工作描述: 项目描述:
在新零售的竞争背景趋势下,对友商(亚马逊、京东、考拉、拼多多、小红书等)的商品信息、价格优惠信息、营销玩法、会场活动等数据进行全方位监控分析,建立全球竞品库,通过数据化手段驱动行业制定竞争策略,且快速有效精准打击竞争对手,保障天猫各品类行业在竞争中处于优势领先地位。
工作职责:
一、商品采集:
1、编写采集脚本,采集亚马逊、京东、考拉、拼多多、小红书等友商的商品基础数据、会场数据、价格优惠信息等
2、清洗采集后的数据,建立多维度数据仓库模型。
二、商品同款匹配:
1、算法匹配:
a.对于部分标品品类采用基于行业规则的同款匹配
b.对于一些非标品类采用标题余弦相似、图片相似、分词、LR等机器学习算法进行匹配。
2、人工匹配:
算法匹配后的记录通过人工进行审核确认,人工也可以直接进行同款商品绑定。
三、数据分析建模&产品应用对接:
1、价格分析:
计算天猫商品和匹配的友商商品的到手价,产出各品类任务的商品高
低价比价结果,应用产品中输出比价报告看板,行业根据比价报告制定竞争策略,及时跟价调价打击竞争对手。
2、热销分析:
根据采集的商品销量、评论数、价格信息等计算商品的热销指数、gmv,并进行同款匹配对比天猫,比较天猫与友商的热销情况
3、友商监控:
采集友商会场数据,对友商会场商品进行分层,对比天猫与友商会场的商品分层,商品高低价,强弱品类分布等情况,及时赋能行业创建动态会场,进行会场竞争。
4、品牌独家监控:
建立天猫与友商品牌映射关系模型,对于在天猫签约独家协议的品牌商家进行违约监控和处罚。
5、品牌招商:
分析出友商的一些优质独家品牌,数据打通品牌招商平台通道,进行品牌引入招商,丰富天猫品牌结构。
6、品类规划-新品引入:
分析出友商的一些优质独家商品,数据打通各行业的产品系统进行引入,丰富天猫商品品类结构。
7、流量调控:
分析出一些热销、主推商品提供给搜索端进行流量加权。
相关使用技术:
1、采集平台: 蚂蚁上数统一采集平台,采集脚本groovy
2、离线大数据计算平台maxcomputer,主要就是数据仓库建模,sql计算,相关算法实现等
3、分布式RPC服务应用框架hsf
4、分布式缓存tair
5、大数据搜索opensearch
6、大数据存储hbase
项目成果:
1、产品监控覆盖了数亿级友商商品数据,数据化驱动行业从多维度制定策略有效打击对手,保障了天猫各行业在日常,大促(618、双十一等)等各种活动中处于绝对优势地位。