工作内容:
1. 推荐
信息流推荐—用户画像:用户离线画像—用户流外画像/用户网页画像等,按照时间窗口(7/15/30等)统计用户的兴趣,使用的技术主要是spark离线分析/写入hbase供线上画像服务使用。用户实时
画像---实时点击兴趣/view兴趣,使用的技术flink。用户时长兴趣预测,利用用户对item的时长log
信息,每条item上取权重最大的一个tag构建样本,使用dnn训练,离线预测用户的tag兴趣,作为
用户的离线时长兴趣。
米家推荐----参与整个推荐流程:召回/粗排/精排/rerank/gr(复用信息流推荐的流程以及各阶段使用的策略和算法)。召回:cb/cf/模型(ytb/dssm等)/向量(gnn);粗排(dssm);精排(dnn/多目标融
合模型essm/ple等);gr层(list wise模型)
用户增长push----模型push:召回:itemcf/热门/搜索/dssm/白名单/点击类别等;ctr模型:使用push
的曝光点击数据,训练dnn模型,离线预测用户的item信息,定时为用户发送模型push
2. 智能营销
用户数据cdp建设—aipl模型:融合用户在小米平台的各种行为信息,构建小米的各产品的用户资
产。完成小米产品的50多个品类的用户数据资产建设
广告的方法----手机品类:使用小米生态内的用户购买/收藏/加购等用户,构建手机的种子用户,使
用lookalike方法,预测手机的人群包,模型预测使用最终使用xdeepfm,迭代路径-
w&d/deepfm/dcn/xdeepfm。手机分机型人群包预测:由分价位每个价位一个xdeepfm模型,迭代到多
任务模型(多任务模型迭代路径-mmoe/ple/mvke)其他品类使用类似的算法策略,生成的人群包在
广点通/emi/巨量/投放,以及小米商城的哨兵营销。