算法工程师
项目
智能列项-广联达
信息提取 文本分类 BERT Docker Flask
基于NLP相关技术,实现对图纸的智能识别和理解,辅助造价咨询人员快速、高质量的完成清单编制工作。
项目职责:
主导算法训练优化方案设计实施。项目涉及实体抽取,文本分类,文本生成等NLP技术。
主导清单列项数据标注标准制定,清单列项知识库搭建。设计评估系统,指导实习生实现。
用户调研反馈,使用该系统清单编制效率提高50%+,以常规住宅为例从之前约1.4~2.3天缩短为0.5~1天。
项目涉及技术与成果:
项目周期1年+,5个模块涉及到模型部分,每个模块都经过不同模型的实验和迭代
基于BiLSTM+CRF实体识别,扩充知识库
基于BERT识别清单和特征项关系
基于PERT实现清单项分组去重
基于FastText识别全局信息
基于Prompt+NanoGPT还原表格信息
系统最终清单推荐结果,清单项F1>93%,特征项F1>85%
AI建筑设计助手-广联达
Stable Diffusion Milvus Flask Prompt
输入Prompt或参考图片,即可快速生成符合需求的效果图。支持以图搜图、文生图、图生图。用于辅助设计创意
联想,或客户方案选型。
项目职责:
负责实现文生图,图生图,以图搜图功能。
项目涉及技术与成果:
基于Stable Diffusion实现文生图,图生图功能。
基于Resnet50,Milvus实现以图搜图。
项目周期2个月,非工作时间完成。最终实现了demo网页效果展示。于22年10月进入公司内部黑马比赛决赛
获奖。
智能客服助手-广联达
BERT
解答智能列项的使用问题,查询列项相关的问题。
项目职责:
负责对话助手的知识图谱的建模和管理。
负责基于知识图谱开发问答系统。
项目涉及技术与成果:
使用 Elasticsearch (ES) 建立与业务相关的问答(Q&A)配对,以及一个可搜索的句向量库。
基于BERT实现意图识别,进而查询用户需要的章节知识信息。
项目周期1月+,为辅助智能列项系统。实现了列项基本知识查询,和单次交互列项。
基于多模态的视频分类-自动化所
Embedding 多模态融合
对于现有的很多视频数据是没有类别的,我们基于视频的关键帧和视频标题来对视频按照自定义类别进行分
类 。
项目职责:
调研实验多模态不同的联合表示,协同表示对分类效果的影响。
视频帧和文本的向量表示与融合,测试不同的表示方法与融合方法。
基于单目RGB摄像机实现三维姿态估计-自动化所
OpenCV 目标检测 姿态估计
项目背景是和英特尔合作的冬奥会花滑运动员花滑动作实时三维建模。
项目职责:
负责实施和训练目标检测模块,确保其准确性和实时性。
提升从2D姿态到3D姿态的网络预测精度。
成果发表在IEEE VR 2021
舆情系统-IDG
Word2Vec 文本分类
由于抓取的信息很多是无效的,多为广告和新闻。所以需要过滤系统来筛选爬取的信息。然后划分舆情类别,从
而帮助投资决策。
项目职责:
对舆情信息进行jieba 分词,去停用词,去除杂乱符号,正则筛选等预处理。
对处理后的数据基于TextCNN/Bi-LSTM 模型进行分类。
网站数据抓取及清洗处理
Requests Scrapy XPath 正则表达式 反爬虫
读研前在电话邦全职做过一年爬虫工程师。抓取过饿了么,大众点评,美团,企查查等各种类型数百个网站数
据,对抓取信息进行预处理。
科研情况
A practical framework of multi-person 3D human pose estimation with a single RGB camera.IEEE VR 2021,
(CCF-A 类会议)
基于深度学习的人体姿态及属性识别与分析系统(RHPARA)V1.0, 登记号:2021SR0660805,2021
参与国家重点研发计划课题《城市空间智能建模与虚实融合》,项目编号:2018YFB2100602
参与国家自然科学基金国际合作重点项目《联合的图像大数据语义分析与城市场景重建》,项目编号:
61620106003