工作描述:
在公司主要从事图像算法为主的算法开发工作,以及以机器视觉为重点的机器学习方法研究。主要项目有:
1、公司自主研发的码图像识别引擎中的图像识别算法开发,包括图像预处理、多重图像定位和准确提取、以及解码识别等一系列全流程图像算法设计开发(难点在不同视距和各种复杂背景下,目标物定位分割,以及远视距下目标物图像质量差时,进行图像增强优化等)。
2、学习和设计对弈技术算法,运用了当前智能博弈搜索算法——蒙特卡洛树搜索(MCTS,用于AlphaGo的核心搜索算法,使得在搜索广度和算力有限时提高搜索集中性,快速的实现收敛并随时可以中断获取搜索结果)的设计并实现,提高产品性能50%以上。
3、同时针对当前人工智能热点技术,进行深度学习理论和机器视觉方面预研(主要研究一般前馈神经网络、CNN和RNN等深度神经网络),以及基于Tensorflow系统的机器学习方法学习,为后续相关开发进行理论储备。
4、进行NLP(语义分析和评价测定)方向的深度学习预研,为公司产品评比大数据分析项目做积累,并完成基于CNN(卷积神经网络)的第一版本的文本分类(语义分析)工作。
5、基于深度学习的方法,完成儿童绘本读物识别项目,主要基于深度学习目标检测识别中的Resnet+FPN+FCN神经网络模型,对绘本读物页面类进行分页检测和分类识别。
6、设计深度学习训练中所需样本集制作的图像样本生成工具,以及自动化标定的工具。
7、完成基于深度学习的可见数字水印检测提取项目,基于类似于5、6中所述的技术,完成对各种类型水印logo(中英文、图像等)以及各种可见度(透明度)的水印检测,检测准确率超过92%(暂时为止为第一版本,项目还在继续)。