下属人数:
薪酬情况: 保密
职责业绩:
实习研究员 研究院 Detection组 北京
主要职责是:
1.协助老板产生/测试能够提升产品精度的实验思路
2.阅读学术文章,给组里的Knowledge Base提供阅读摘要
部分研究结果:
1. 多种损失函数对分类器的效果的影响 采用Cifar10,MNIST和ImageNet数据集进行测试,用Tensorflow实现。分类器选择ResNet20和ResNet50;损失函数测试了CE Loss,L1 Loss,L2 Loss, Smooth L1 Loss, Centor Loss, Centor and Variance Loss, Dirichlet Regularized Loss 和Entropy Regularized Loss
2. 基于Gan的模仿生成对行人PF模块数据进行扩充 负责对PF模块的数据进行扩充,使用Tensorflow实现。 通过对PF模块的训练数据进行扩充,进而训练更强的模型
3.一个翻转数据类别扩充trick 提出将翻转的行人图像作为一个新的负类别数据扩充进入数据集,提高模块准确率 提出了一个新的trick,用来提高模块的准确率 将翻转后的行人数据作为一个新的类别(即“翻转类”),扩充训练集。扩充的动机是这种扩充可以强迫模型学习一些非上 下对称不变的分类特征,从而强迫模型学习到的特征对非人情况的鲁棒性。后来进行的实验也证明了这个trick能涨点。
4.多种优化算法对Lasso问题的求解实现
使用次梯度,坐标下降,Smoothing Method,Proximal Gradient Method,Primal-Dual Method, ADMM等多种优化算法 实现求解Lasso问题, 基于Python和Scipy/Numpy进行实现。
5.DQN模型实验在几个Atari游戏中的实现
在部分强化学习(游戏)环境下实现DQN,Policy Gradient等强化学习模型和算法。基于Tensor flow和Gym实现。 实现的环境包括CatePole,Breakout,Space Invader等游戏环境,以及MuJoco Humanoid仿真环境;实现的算法模型包括 DQN,Dueling-DQN,Double-DQN,DPG,DDPG,TPOR等。