工作内容:
1、负责自动驾驶感知算法的模型优化和GPU利用率等指标提升,定位模型训练失败的原因并进行解决
2、负责HaomoAIFramework相关SDK或API等功能组件的开发和需求定制开发
3、负责公司内部AI推理框架的设计、开发和维护,提升模型推理速度
4、参与K8s集群GPU资源相关指标自动采集的服务开发
5、参与开源优化加速框架的调研和模型适配以及大模型上云训练等工作
涉及技能:NsightSystems、Profiler、DLProf、Python、C/C++、PyTorch、Golang、MMCV、OpenPCDet、
Docker、K8s、Dragongfly、CNN、Transformer、点云、训练优化加速、推理优化加速