公司主要从事智能车载系统的相关设计开发
基于SSD模型的图像识别分类系统
功能: 利用原始图片等相关标注数据,依靠深度学习,卷积神经网络,研究开发高效的计算机视觉算法,监测图像是否包含相关标注的物品以及输出对应的坐标位置,完成定位与筛查功能。
所用技术: ssd、opencv、tensorflow、vgg16
项目职责:
(1)、完成基本的SSD模型框架的搭建与使用:
通过VGG16的模型完成图像从300*300到38*38的转变,再利用相关的卷积神经网络与maxpooling技术,完成19*19、10*10、5*5、3*3、1*1等相关特征图像的准备工作
在不同的大小的特征图像中完成不同的先验框设计,各个特征图像先验框个数依次为4、6、6、6、4、4,最终完成8732个先验框坐标的确定
利用先验框与真实的标签坐标进行IOU交并比值验证,通过阈值完成正样本与负样本的分类
通过先验框的位置完成与真实标签框坐标的encode和decode,创建中保证所有的真实ground truth均有先验框与之匹配
(2)、利用tensorflow框架构建上述以vgg16模型为基础的ssd算法模型进行训练
(3)、通过位置损失和置信度损失函数,校准模型的相关参数,使得模型更为健壮,准确率达到95%以上
项目名称: 基于Facenet的人脸识别系统
使用场景: 车载全自动语音控制的登录系统,以人脸识别作为用户登录的唯一标志,通过刷脸,实现车载系统控制的最高权限
项目描述: 利用计算机图像处理技术从摄像头获取的照片中提取人像特征点,利用生物统计学的原理进行分析并建立相关的特征向量实现自动匹配数据库内相关数据,完成已经注册过人员的身份验证功能
项目职责:
通过MtCNN模型获取人脸相关坐标位置特征x,y,h,w
送入一个卷积神经网络,深度提取脸部显著特征点
把脸部特征映射到一个新的特征空间,形成一组新的特征向量
通过L2正则把特征空间进行标准化处理
以Triplet Loss为监督信号,获得网络的损失与梯度
通过优化参数,最终模型预测准确率为99.63%
基于LSTM的Seq2Seq人机对话系统
功能: 实现车载系统的人机对话模型
所用技术: LSTM、tensorflow
项目职责:
(1)、整个系统主要依据于LSTM模型,LSTM模型基于RNN的大框架产生,实现了Encode-Decoder的同时增加了Attention机制,所以文本传输带有更多的上下文信息
(2)、文本数据预处理和清洗,制作训练样本,分组传入训练文本
(3)、利用tensorflow深度学习框架构建LSTM算法模型,然后进行1600轮训练,完善相关的模型参数
4、医疗命名实体识别
功能: 对上海瑞金医院的各种疾病名称及设备等关键词的提取和识别
所用技术: BiLSTM-CRF、IDCNN-CRF、tensorflow、jieba。
项目职责: (1)、文本数据预处理和清洗,制作训练样本
(2)、对文本进行分词,并把分词信息进行编码
(3)、利用tensorflow深度学习框架构建BiLSTM-Crf和IDCNN-CRF两种算法模型进行训练
(4)、利用viterbi算法对模型预测结果进行解码,输出最终结果
5、基于爬虫技术的白马股筛选
功能: 全自动网上爬取有效数据,分析汇总数据,生成最终需要的白马股表单
所用技术: python爬虫、selenium webdriver、openpyxl、numpy、pandas。
项目职责:
(1)使用selenium webdriver配合谷歌浏览器chromedriver.exe实现网页的自动登录
(2)通过自动访问i问财网站和理杏仁网站,识别按键,列表数据、捕获对应数据
(3)利用pandas对获取的数据进行处理,计算出最终的有效数据,通过openpyxl xlwd xlwt实现对execl表格的操作,把最终数据保存在对应的execl的表单中