ctr 预估系统: 完成整个从特征到算法和系统的设计与开发工作
a. 算法选择:以 ctr 为目标的推荐排序要考虑海量的数据和大量细粒度离散特
征,因此从精度,特征组合,稀疏,效率上综合考虑,选择 FM+FTRL 方式。
b. 模型分为 online 和批量,online 的引入是为了解决由于训练预测的时间 gap 导致
特征和 label 之间 correlation 与 causation 不一致的问题。
c. 结果: ctr 提升 15.02%, pv ctr 提升 15%,uv ctr 提升 24.7%,新闻曝光量提升:67.5%。
推荐引擎系统:参与架构设计和联调,以及跨部门推进等工作
a. 之前架构在加入很多策略算法后,支撑数亿 pv 很艰难,需要重新规划设计。
b. 主要工作: 参与系统设计,跨部门推动工作,对系统和算法进行联调等工作。