1、需求调研与分析:与业务部门合作,深入调查和了解项目数据来源、数据类型和特点、业务痛点与核心需求。
2、维度建模:根据业务需求,最小化粒度原则,设计合理的数据模型,星型、星座模型,建立数据模型。
3、ODS层数据抽取:开发hivesql脚本,编写json,使用ETL工具从oracle、mysql等数据源抽取数据到数据仓库的ODS层
(数据贴源层),保持与源系统数据一致,便于后续的数据处理和审计。
4、DWB层数据抽取、清洗和转换:整理Mapping映射,处理空值、异常值、敏感数据,使用Hivesql、Impala等大数据处
理工具开发hivesql脚本,将数据由ODS层抽取到DWB层(数据仓库层)。
5、DM层数据指标开发:根据业务部门的具体需求,将DWB层的数据进一步转换和聚合,使用hivesql开发DM层数据(数据集市层), 针对特定主题,建立小型数仓,方便业务部门进行具体的业务分析。
6、BI层报表开发:协助BI伙伴使用帆软FineReport、FineBi开发报表、大屏、移动端、填报数据等,实现数据的可视化,
方便业务人员直观理解数据开发成果,支持决策制定。
7、定时任务创建:在xxl-job平台上创建数据自动化抽取定时任务,并分层配置任务的子任务,完成数据从源数据到数据仓
库的ODS层---DWB层---DM层---BI层的自动定时抽取。
8、测试和优化:数据开发完毕之后,进行系统测试,根据业务使用情况,进行必要调整,提升系统性能和用户体验。