课程简介
本套项目教程以线上问诊为基础业务,真实还原了线上问诊平台对于用户数据的分析和统计,并以大屏展示的方法呈现数据分析的结果。
线上问诊离线数仓项目共分四大部分:数仓建模原理介绍、数仓模型搭建、DolphinScheduler 全流程调度、SuperSet 可视化大屏展示。项目以线上问诊采集项目为前置基础,使用线上问诊采集项目的基础架构,将数据导入数仓中,对数据进行系统化的分析计算,得到指标需求结果。
项目中使用的框架包括:Hadoop、Hive、Spark、Kafka、Flume、Flink-CDC、Datax、DolphinScheduler、SuperSet 等。通过本套视频教程的学习,你将彻底了解数仓建模理论体系,深入认识线上问诊平台的业务理论体系。