北京仝睿科技有限公司是一一家专⻔门从事智能文本理解与应用的科技型企业,具有完全自主知识产权
的“仝睿文本智能平台”,为行业客户(包括企业、机构以及个人)提供全方位的文本分析与理解方
面的PaaS服务和SaaS应用。
领导搭建与研发基于storm的实时分布式爬虫及监控系统,实现自动化部署及可配置化爬取。结合
机器学习等技术实现实时文本分析、信息提取。
参与研发“仝睿文本智能平台”,提供面向企业的PaaS、SaaS文本分析与理解服务应用。
悉尼大学与Notion合作项目:AI in Strategy
开发用于从大量文本自动生成商业智能的工具。
使用NLP及机器学习等技术实现主题聚类
Python实现后台大数据分析,以及UI界面实现,数据可视化分析
流式细胞术数据分析
分别使用Apache Spark / Flink框架分析流式细胞术数据,以研究生物体对病毒感染的免疫反应。
K-means聚类,分布式处理大数据
实现语言:Java
Github链接
https //Github.com/NickGH329
技能清单
C/C++/java/python等多⻔门编程语言
熟练运用MySQL/Neo4j/mongoDB等数据库及语言
机器学习/深度学习/NLP相关知识
了解多种机器学习算法数学原理,代码实现及优化
CNN/RNN/LSTM等深度学习框架
了解多种特征提取及特征选择方法,NER模型
掌握pyTorch, dyNet等框架
云计算/并行计算
HDFS/Spark/Flink编程
MPI/Pthread线程编程
掌握storm分布式实时大数据处理系统
大数据
具有分布式爬虫开发经验及数据挖掘、知识图谱等相关经验
熟悉Elasticsearch搜索发动机
信息管理及信息安全管理等相关知识