1、语音唤醒
负责公司定制唤醒技术的研发,包括模型训练优化,引擎部署调优,应用于公司车载系统等业务。
从零到一实现了自定义唤醒技术的研发;包括了模型训练,以及实现引擎部署开发调优。
2、声纹识别
训练框架开发: Kaldi+PyTroch从零搭建训练训练平台,实现主流说话人模型(TDNN、FTDNN、ECAPA-TDNN等)以及
E2E说话人识别,该训练平台支持了公司说话人识别、情绪识别以及说话人性别、年龄、口音等算法。
说话人识别:负责核心说话人识别、说话人分离模型训练,完成多个版本的迭代,应用于公司司机身份验证、司乘角色分离
等业务。
推理引擎开发:从零实现语音线上推理引擎,支持不同硬件平台的优化开发。
3、开源项目
参与Delta(https://github.com/Delta-ML/delta)开发,包括deltann的开发以及部分模型的开发工作。
主导了Transform(https://github.com/athena-team/athena-transform)的设计开发工作。
参与了Athena(https://github.com/athena-team/athena)的开发。