(java,go,scala,python,tensorflow,esmm)
2020.03-2020.9 统一知乎商业内容(付费回答、知+、好物推荐等)在首页推荐页的流通
离线部分,将所有商业内容的数据接入一张表,而后形成报表,用统一的指标来衡量变现效率。
* 在线部分,在online learning多目标学习模型的基础上引入用户价值和商业价值,在rerank阶段形成统一的加权公式,根据效果来调整参数确定不同商业内容的分发量。
* 最终使得商业内容曝光不变的前提下,收入增长20%左右。
2019.09-2020.03 负责付费回答项目
* 在数据层面,发现热门内容的opm很高,增加热门召回队列;通过观察样本数量与真实曝光差异,
发现监听了错误的kafka,换成正确的kafka后,opm提升15%。
* 在排序阶段,由xgb模型迁移到esmm模型,使得排序阶段考虑点击率的同时优化订单量。
* esmm最终效果曝光降低20%的前提下,订单量增长20%,opm提升50%。
2019.04-2019.09 构建统一的召回系统
* 推荐组有很多方向,用的是各自的召回,为了提高效率,集中精力做一些通用的召回。
* 协同过滤方面,实现word2vec和jaccard两种方式,深度网络方面增加youtube dnn召回。
* 使得新业务增加对应召回的时间大大缩短,从几周缩短到几天,同时对现有业务的点击率也有5%左
右的效果提升。
2018.10-2019.04视频推荐、问题多元化、回答推荐、文章推荐、相关搜索等项目的开发与维护
* 从事多个项目的更新迭代工作,在召回方面,增加keyword和topic embedding的fasis召回。
* 在排序方面,用kafka落特征,offline用spark拼label,用xgb训练模型,在线请求ranking服务,排
序后经过去重、过滤后返回给后端。
* 其中回答相关推荐用visualVM定位最耗时间的代码,降低无效请求,节省容器资源。