前沿研究与应用:深入研究并应用前沿人工智能技术(如transformers、RNNs、GNNs、生成式模型、强化学习)、语言模型(LLMs)以及AI-Agent,探索其在蛋白质序列建模和生物信息学中的应
用。
算法设计与优化:设计和优化多种机器学习模型和深度学习模型,应用于蛋白质文库设计和启动子增
强子的设计,研究常见优化算法及深度学习算法理论。
平台构建与数据分析:构建和优化深度学习计算平台,支持生物信息学数据处理、蛋白质工程、计算
生物学应用,进行数据分析和可视化,展示模型性能和研究成果。
分布式计算与加速:实现单机多GPU和多机多GPU的深度学习分布式计算,加速模型训练和推理过
程,利用容器化技术部署算法pipeline,使用AutoML进行超参数搜索和网络搜索。
生物信息学与计算生物学:应用常用生信工具和分析库进行序列比对和分析,研究CADD软件及相关
算法,进行蛋白质表征、同源建模、分子力学和分子动力学模拟。
自然语言处理与图像处理:在NLP任务中应用transformers结构模型,掌握传统图像处理算法及深度
学习模型,进行图像分类、分割和目标检测。
项目管理与系统架构:负责项目方案制定、开发协调和项目推进,设计服务器架构、API接口和数据
库模型,整合算法模块的数据流,推动整体AI平台建设和改进。