互联网娱乐与广告平台部
项目1:线上广告投放平台
面对传统移动端媒体,和一些短视频和直播场景的创新形式,搭建线上私有广告投放平台,主要负责:
1.广告检索系统,包括:
广告数据加工,生成索引
以微服务的形式提供广告定向,排序,校验等
支持传统广告形式(banner,开屏/插屏,图标),支持原生广告形式(信息流),支持创新广告形式(AR广告,小游戏,优惠券)。
支持状态控制,时段控制,限额控制,匀速投放,频次控制等功能。
支持一些个性化需求,如广告位定投广告等等。
使用技术:位图索引,thrift,MapDB,Redis
2.用户标签体系搭建:
清洗日志数据,根据规则提取用户标签,包括人口统计学标签(年龄,性别,地区),设备标签(设备类型,品牌,操作系统类型等等),用户行为统计标签(高频,高点击等等)。
对不同的用户标识进行ID Mapping,生成用户标签表。为广告定向投放提供条件,为数据挖掘模型提供特征。
使用技术:spark
项目2:线下广告投放平台
主要针对酒店的线下广告场景,搭建线下广告投放平台,主要负责:
1.广告检索系统,包括:
广告数据加工,生成索引
以微服务的形式提供广告定向,排序,校验等
与线上广告平台的广告定向有些不同,需要根据线下广告的一些特点重新开发,主要区别是广告位的差异化,广告的排序方式,校验规则,第三方广告的处理等等。
使用技术:位图索引,thrift,MapDB,Redis
2.酒店标签体系搭建:
作为平台线下广告投放所在的主要场景,酒店本身的数据具有很高价值,需要补充,原本只有酒店名称和酒店地址,根据这两个信息去一些第三方平台爬取信息,或调用地图API获取信息,首先验证酒店的可信度,然后给酒店打上所在地区,类型,档次,商圈,特色,是否在机场附近,是否在火车站附近,是否在景点附近等等的标签。
使用技术:python,爬虫,mysql,spark
项目3:FaceID
公司战略探索项目,寻求以人脸FaceID作为一个人的唯一标识,建立用户标签库,打通以设备ID(IMEI,MAC,IDFA,安卓ID)等等为用户标识的线上用户数据,和各种线下设备采集到的用户数据。
以微服务的形式提供服务,输入为一张人脸图片,返回对应的FaceID。
对规模不同的底库,采取不同的策略,保证效果和性能。
使用技术:人脸比对SDK,spark,thrift,faiss