负责智能销售语音助手、智能推荐系统的架构设计和算法开发。负责项
目管理工作,协调算法、后端、前端、BA等多人一起推进项目。
技术栈和技能:
自然语言处理、知识图谱、数据前处理(去重、过滤等)、数据增强和标注、人工智能、机器学习、深度学习。
Python(PyTorch、TensorFlow、Hugging Face、PaddlePaddle)、DeepSpeed、Megatron-LM、Spark MLlib(Scala)、Hive、Impala、SQL、Shell。
主要方法:
文本类大模型(ChatGPT / InstructGPT、T5、Bert、Transformer等)、预训练(架构、训练目标、3D并行技术等)、后训练(精调、提示工程/RLHF、指令精调、思维链提示等)、生产部署(蒸馏、量化、剪枝等压缩技术,以及硬件加速技术等)。
智能问答/对话系统/聊天机器人(基于信息抽取的系统、基于知识库的系统、生成式系统、框架系统、倒排索引)。
循环神经网络、卷积神经网络、Latent Dirichlet Allocation、TextRank、Naïve Bayes、fastText。
XGboost、LightGBM、Random Forest、GBDT、FP-Growth、ALS。
Prophet、傅立叶变换。
⾃我简介 :
五年+互联⽹机器学习和商业分析经验、⼗⼀年⽣物学机器学习和数据分析经验、四年互联⽹团队管理经验。
能够形成适配不同业务场景的算法⽅案,并协同相关业务⽅,赋能和推动公司业务增长。
可以利⽤⼤模型等 NLP 技术,完成智能问答、任务型对话系统、聊天机器⼈、搜索引擎等系统的算法开发,以及⾏业知识图谱的构建。
能够利⽤ PyTorch、TensorFlow、Hugging Face、PaddlePaddle、DeepSpeed、Megatron-LM、ONNX 等框架完成⽂本类⼤模型的预训练(架构、训练⽬标、3D 并⾏技术等)、后训练(精调、提⽰⼯程/RLHF、指令精调、思维链提⽰等)、⽣产部署(蒸馏、量化、剪枝等压缩技术,以及硬件加速技术等)等流程,以及⼤模型在⽂本⽣成、信息抽取、⽂本分类、⽂本摘要、机器阅读理解、机器翻译等下游任务中的应⽤。
可以根据公司需要,完成 AI / ML / DL / NLP 等领域顶级会议或期刊学术论⽂的发表,以及专利撰写。