发明与使用多种数据科学方法支持多个业务增长。例如:发明生存函
数分层收敛的方法帮助孵化产品优化留存,并被实验证实有7%的7
留提升(其余指标也均有提升);使用数据科学方法帮助定位PMF人
群,并形成方法论,完成通用化与工程化设计。主导push中台优化
的数据科学与因果推断部分。
⚫ 综合使用因果推断、机器学习等数据科学手段支持BG战略分析。例
如:发明利用因果推断方法帮助大型业务制定北极星指标与搭建指标
体系的方法,该工作在VP联席会汇报,并在BG多个业务推广;主
导利用do演算评估业务ROI并指导预算分配;使用uplift模型发现
内部流量交换机会等。
⚫ 潜力 KOL 推荐算法优化。通过数据分析和建模,定义新的目标函
数,优化算法框架,在潜力值之外引入了新鲜度的概念。优化后在某
业务中 topN 准确度提升1倍,对应北极星指标提升20%。
⚫ 主导数据科学工程化的相关工作。包括指标异动归因工具,留存魔法
数字工具,潜力 KOL 工具等。均在 MVP 阶段独自基于 python 完
成全部开发,使用 docker、k8s 等 devops 工具完成持续集成等流
水线,并后续指导相关工程与DS同学完成正式版本上线。
⚫ 参与公司内外的开源建设。例如:AB 实验中台共建:基于 pyspark
独立设计和实现了通用化指标计算、AA 回溯和交叉维度 OLAP
pipeline,以及与 web 后台的交互方案。在多个项目应用开源
kneedle代码过程中,增添部分功能并被merge到主分支。
⚫ 参与LTV预估、内部导流、广告投放的部分工作。
⚫ 优化实验评估方案,例如幂率指标的谱指数评估方案,多实验组DID
评估与置信度计算方案等。
⚫ 在上述工作中总结多个方法论,形成4项专利(2项第一发明人),
部分工作形成BG内数据科学序列的必修课并主讲,多项工作在内网
发布并成为邮件与首页推荐文章,多次获得部门与公司的奖项。