孵化:项目团队从0 到1,从 1 到 N 的孵化,研发的数字人产品成功助力小i集团2023年在美国纳斯达克上市;
团队:组建数字人团队共30+人,制定人才培养体系,业绩考核,组织例会和内部交流学习活动,团队文化建设;
算法:数字人唇形表情动作驱动、图片视频生成、智能交互等基于Diffusion model、GAN、GPT的算法研发;
项目:负责 KA 客户项目,包括江西赣州数字人“小赣“ 、中国电信、上海外服等数百万量级项目的售前到交付全流程;
产品:研发数字人智能交互、数字人视频生成、数字人直播等SaaS平台产品,产品参展进博会、世界人工智能大会等;
架构:设计SaaS产品架构、数据和模型中台架构,构建模型云端部署框架,团队技术选型和技术指导;
合作:组织团队与北大清华等高校交流合作,和供应商合作伙伴火山引擎、相芯、微软小冰、声瀚等公司的产研合作;
商务:对接数十个城市渠道代理商销售产品,与公司其他高管、销售进行部分KA客户销售、售前对接、商务洽谈等
发明专利 已申请8项:
1. 基于微调模型的视频图像换脸方法、装置、设备及介质;
2. 对抗生成网络的图像属性编辑方法、装置、设备及介质
3. 服装标签生成方法、装置、电子设备及介质
4. AI主播视频的生成方法、装置、电子设备及存储介质
5. 服装设计方法、装置、电子设备及存储介质
6. 人脸几何模型提取、3D人脸重建方法、设备及存储介质
7. 人脸纹理特征提取、3D人脸重建方法及设备及存储介质
8. 一种2D平铺服装设计方法、设备及存储介质
计算机软件著作权:8项
包括视觉工厂(视频)系统、视觉工厂(图片)系统、AI模特直播工具系统等;
会议论文:10+篇
与浣军博士跟国内外高校和研究机构进行产研结合合作,提供学术和技术支持。
团队产研学术成果以浣军博士和公司名义署名发表十多篇顶级会议论文,包括AAAI、ICCV、ICML、ICLR等AI相关领域的国际顶级会议:
1. Knowledge Distillation with Attention for Deep Transfer Learning of Convolutional Networks. TKDD’2021
2. Semi-supervised active learning with temporal output discrepancy. ICCV’2021
3. On the noisy gradient descent that generalizes as sgd. ICML’2020
4. Rethinking Local Community Detection: Query Nodes Replacement. ICDM’2020
5. Local community detection in multiple networks. SIGKDD’2020
6. Ultrafast Photorealistic Style Transfer via Neural Architecture Search. AAAI’2020
7. FSNet: Compression of Deep Convolutional Neural Networks by Filter Summary. ICLR’2020