职责业绩:
1. 负责 Lazada 内容电商业务的整体建设与规划,系统化的打造整个内容电商技术体系,主要包括内容业务体系(内容供给、内容理解、内容运营、内容分发、内容消费)、工程架构体系(百亿级系统容量、三段式内容推荐系统、实时数据链路)、数据体系(埋点、指标和口径、公共层数据治理、应用层数据集市)、研发运维体系(Scrum、云原生、微服务、Devops、监控和报警)、安全合规体系(风险内容治理、降级限流、防攻击防渗透、本地化合规),成为支撑Lazada 内容电商业务的坚实底座
2. 探索出一条通过 AIGC 生成自主可控优质内容的可行路径,通过抽取优质商品内容、优质买 家秀内容,调用大模型能力进行文本改写,生成精简且有信息量的文本,同时生成图片 prompt,利用 Stable Diffussion 生成对应图片,部分类目使用蒙板图层进行 AI 换装,实 现了自动化批量生成图文内容的目标,基本解决了优质内容供给匮乏的问题;建立 AIGC 账 号矩阵,通过运营和技术手段搭建账号 prompt 库,实现不同账号在不同条件下生成具有差 异化内容的目标,解决了内容同质化的问题;主要应用在生成商品导购内容、商品评价、商 品横评等场景,AB 测试的结果表明,AIGC 内容的 UCTR 提升 4.2%,IPV 提升 3.6%,相 关工作还有很多优化空间,随着工作的深入(训练 Lora 模型、优化换装效果、优化图片真实 度等),预期还有更好的表现
3. 主要的贡献点包括,通过架构优化将系统扩展到支持百亿级数据容量,在日益上涨的 qps 压力下,仍然实现了 rt 的近 10 倍提升;建立数仓公共层和应用层数据体系,彻底解决了数据质量低、指标口径不统一、取数效率低下的老大难问题;建立一段保量、二段赛马、三段助推的三段式内容孵化系统,打通实时数据链路,根据用户行为实时推荐个性化内容,对标业界前沿水平;通过基于规则(重复内容、无声视频等)和基于模型理解(黄丑图、水印、噪声、模糊、包裹、相似等)的自动审核机制,使用技术手段打掉占比 48%的风险内容和低质内容,大幅减少人工审核工作量,节省审核人力成本
4. 在东南亚开展业务的六个国家中,Lazada 的日活跃用户达到数千万,其中内容业务日活跃用户达到数百万,在历次双 11、双 12、BDAY 等大促日的流量洪峰中,保持零故障的稳定表现,有效支撑内容业务成为 Lazada 与友商竞争的差异化优势之一
5. 看机会原因:战略性业务收缩