主要项目经验: 品牌作者挖掘、文章质量分优化、垂类等级优化、图文质量优化、知识库问答系统
利用TF-IDF、textrank提取关键词特征,结合LDA提取文章主题。利用word2vec、glove、fasttext、
transformer、bert等分类算法,做垂类文本分类,提升审核人效,准确率85%。
使用textcnn等分类算法,完成文本分类。构造作者、文章特征矩阵,构造DSSM模型,通过训练好的作
者embedding及文章embedding,完成topK作者文章召回排序。通过规则策略模型召回优质作者文章。
训练albert+textcnn,构建意图识别模型。并迭代bilstm+crf 的NER实体抽取任务。
基于知识库信息,优化问答推荐信息,构建知识图谱问答系统