工作:1.医疗影像人工智能算法的研发和落地包括图像分类,目标检测,实例分割,语义分割等视觉
算法
2.AI算法的异构计算和模型边缘端和云端的部署及产品化,熟悉TensorRT,OpenVINO,
ONNX,NCNN, 华为昇腾等模型推理加速,熟悉模型量化,剪枝,蒸馏和图结构的优化。
3.自然语言处理算法的研发和落地包括对话机器人,知识图谱,实体识别,关系抽取,文本纠
错算法的研发和产品化
4.语音识别和语音合成的算法研发和落地,目前已产品化粤语TTS模型,语音识别完成测试
5.大模型(LLM),多模态大模型(VLM)的预训练(在研已基本熟悉),词表扩充,高效的指
令微调,和基于垂直领域的知识库(向量数据库)+大模型的应用(基于LangChain),已微
调过多个大模型和多模态大模型。
6.大模型的加速推断部署,熟悉大模型的模型加速部署方案TensorRT-LLM,vLLM及云端部署
方案TritonInferenceServer,熟悉大模型部署中的WeightOnlyQuant,SmoothQuant,GPTQ,
AWQ等PTQ量化手段,K,VCache,inflightbatching,streaminginference及TensorParallelism
和PipelineParallelism等Trick.