1、轨迹分类项目:该项目旨在识别高德客车导航入口轨迹中非自驾轨迹,从而利于路线规划以及时间预估的准确性
• 负责:三个层面对轨迹分类项目进行优化:数据层面:构建轨迹分类模型所需的数据和特征;模型层面:优化模型结构:
从xgboost,DeepFM,DCN以及DCN-mix中,选择DCN-mix;loss层面:对于样本不均衡问题引人了focus loss
• 效果:客车导航入口非机动车轨迹日均召回量增加150w,路线规划首条实走覆盖率提升0.3%
2、饿了么内部道路挖掘项目:该项目旨在利用轨迹对内部道路进行离线挖掘,提升内部路质量,辅助骑手路线规划
• 负责:对高质量内部路轨迹构建空间和转移相关特征,结合路网特征,输入到图像分割Unet网络中,利用网络学习现有的
内部路网先验知识和识别新增道路
• 效果:整体算法准确率80%,节省73%人工成本,辅助提升内部路质量4.8%,badcase量级下降37%(6000->3800)
3、导航播报拟人化项目:该项目旨在对导航播报话术文本进行拟人化风格改写,提升用户体验
• 负责:构建利用少量样本进行导航播报话术可控拟人化改写的流程机制,调研新的算法,结合大规模预训练模型Bart,通
过self-training以及Diffusion model、GAN等方式生成多样、可控的拟人化文本
• 效果:自动化产出具有风格的导航播报话术,相比于人工手写方式,极大缩短了产出周期,能天级产出和快速迭代优化
4、参与导航播报模型化项目:该项目旨在对导航播报内容进行模型化自动生成,代替策略
• 负责:结合现有多任务模型框架(HPS、CS、MMOE、PLE)和自身业务特点,对导航播报业务场景进行多任务模型架构
设计,同时进行十亿级数量训练pretrain模型,并利用线上收集小场景下AB实验数据对pretrain模型进行finetune,得到
小场景下最优推荐播报模型
• 效果:pretrain模型和线上策略的diff差异控制在4%之内,在播报内容透出率不变的情况下,播报密度有所下降,目前进
行线上AB分流实验中