奈学教育《数据分析实战速成班》课程大纲

随着大数据及人工智能的迅速发展,数据分析、数据挖掘、大数据等相关岗位大热;数据分析从海量数据中提取重要信息,继而进行分析企业现阶段的整体运营情况,了解各项业务的发展及变动情况;针对...

随着大数据及人工智能的迅速发展,数据分析、数据挖掘、大数据等相关岗位大热;数据分析从海量数据中提取重要信息,继而进行分析企业现阶段的整体运营情况,了解各项业务的发展及变动情况;针对企业运营现状进行原因分析,指导业务发展,预测将来可能发生的情况,如金融信贷用户违约,防止电商用户流失等。课程通过多业务场景引入,深度讲解数据分析底层思维逻辑、相关技术工具,让你成为更懂业务的全栈大数据分析师!


阶段一:行业指标分析&数据分析思维方法论

第一单元
数据分析技能在各行业业务应用
1.如何定义数据和指标
2.数据分析师主要职责
3.数据分析师的工作场景以及工作内容
4.数据收集
5.数据存储
6.数据处理
7.数据分析
8.数据可视化
9.数据分析报告
10.数据分析师素质要求
11.数据分析行业
第二单元

指标&搭建指标体系&数据分析项目流程                                           

1.常见产品运营指标
2.用户获取:广告转化、渠道转化、渠道ROI、日应用下载量、用户获客成本
3.用户活跃:用户会话次数、用户访问时长、功能使用率、用户消费情况
4.用户留存:日留存、N日留存、周留存、用户流失率、退出率、K因子
5.用户传播:病毒传播周期、用户分享率、活动曝光量/浏览量、活动参与率
6.常用业务模型
7.用户结构分析:自然属性、社会属性、商业属性、心理属性、行为属性
8.用户行为分析:点击、浏览、转发、收藏、购买
9.用户价值分析:用户交易数据、广告价值
第三单元
商业智能分析方法论&分析方法
1.对⽐分析法
2.分组分析法
3.结果分析法
4.漏斗图分析法
5.矩阵关联分析法
6.SWOT/态势法
7.5W2H/七问法
8.逻辑树分析法
第四单元搭建用户生命周期和用户增长模型
1.用户生命周期:引入期、成长期、成熟期、休眠期、流失期
2.用户⽣命周期运营策略:引入期-新客、成长期-首次成交用户、成熟期-忠实用户、休眠期-潜在流失用户户、流失期-流失用户
3.AARRR⽤⼾增长模型:获取/Acquisition、激活/Activation、留存/Retention、收⼊Revenue 和推荐/Referral
4.获取用户/Acquisition-用户如何找到我们
5.激活用户/Activation-用户的首次体验如何
6.用户留存/Retention-用户会回来吗
7.变现/Revenue-如何赚到钱
8.RFM模型概念及原理
9.如何使用RFM模型进行用户价值分类
第五单元                              数据分析&行业分析     
1、快速使用Excel 技巧
     1.1  查看 Excel 版本
     1.2  快速定位菜单功能按钮
     1.3  快速访问工具栏
     1.4  固定首行
     1.5  快速找到某个工作表
     1.6  自动生成编号
     1.7  高频使用快捷键
2、 业务场景实战&分析方法应用
     2.1   对比分析法解决哪类产品销售好的问题
     2.2   运用趋势分析法分析水果总需求如何
     2.3   对各品类数据进行分组,对不同组进行不同对待-矩阵关联法(象限分析法)
     2.4   销售情况分析-分组分析(分布情况)
     2.5   运营环节转化情况-产品用户行为分析(漏斗分析)
     2.6   用户价值分析-RFM建模
3、数据透视表
     3.1   数据透视表要求
     3.2   创建数据透视表
     3.3   数据透视表布局&多行,多筛选,值,空白行
     3.4   多筛选格式调整&数据透视表选&项布局和格式
     3.5   统计方式及值格式调整&值字段设置
     3.6   数据透视表多维度计算&计算字段_横向计算,计算项_纵向计算
4、项目实战:电商销售分析看板、公众号监测仪表板
     4.1   业务场景:品类销售、用户类型、城市排行、商品特征、新关注人数,取消关注人数,净增关注人数等
     4.2   数据准备
     4.3   制作主要步骤
     4.4   分析图表
     4.5   撰写数据分析报告

第二阶段:MySQL商业分析实

第一单元

SQL查询业务指标
1.下载&安装MySQL数据库
2.MySQL存储引擎及数据类型
3.IF语句、CASE语句等流程控制语句
4.DISTINCT去重查询
5.WHERE条件查询
6.GROUP BY、Having 分组查询
7.ORDER BY排序及LIMIT限制行数查询
8.COUNT、SUM等聚合函数查询
9.IN/子查询、ANY/子查询、ALL/子查询
10.汇总函数:Count、Avg、Sum、Max、Min
11.算数函数:Round、ABS、Mod
12.字符串函数:Length、Lower、Upper、Concat、Replace、Substring
13.日期函数:Corrent data、Corrent time 、Correct timestamp、Dataname
第二单元SQL高效查询优化
1.使用索引加快查询效率
2.增加中间表优化查询
3.多表查询优化
4.建立索引涉及where、order by
5.慎用in、not in技巧
6.exists代替in&使用varchar代替char
7.常用事务操作
8.Sql查询优化细节
第三单元    构建结构化业务数据库/表                                                     
1.根据产品业务逻辑构建数据库
2.创建数据表
3.数据约束操作
4.数据更新操作
5.数据删除操作
6.修改表元素&添加列
7.添加自动增加的列
8.主键约束
9.唯一性约束
10.外键约束
11.检查约束
第四单元                                     业务指标统计分析
1.Row_number() over()等窗口函数查询及数据分析
2.LEFT JOIN等业务数据表关联查询
3.UNION、UNION ALL查询结果纵向合并融合
4.应用带IN、EXIST、ANY、ALL的子查询处理复杂业务逻辑
5.交叉表统计分析
第五单元实战项目 
活动销数据统计分析(多表查询)
用户价值划分模型(RFM模型)
      一、业务场景:统计平台销售情况
      二、灯塔指标:下单用户数,订单量, GMV,客单价,取消订单量,订单取消率,退货订单量,商品退货率、GMV 趋势,各渠道GMV趋势、购买频次,订单金额分布
      三、分析方法:
             1.SWOT/态势分析法
             2.汇总统计
             3.对比分析
             4.分组分析
             5.确定指标计算口径
      四、使用工具:SQL
      五、可视化分析:饼图,环图,折线图,漏斗图
      六、结论:
            1.数据获取
            2.支持可视化和分析

第三阶段:分布式大数据应用Hive查询

第一单元
HQL大数据业务数据需求查询                               
1.大数据集群Hadoop分布式架构原理
2.HDFS、MR、YARN
3.Hive数据仓库
4.HQL数据查询基础语法
5.HQL与SQL的区别
6.数据库基本操作-库、表
7.分区表概念
8.分区意义和本质
9.动态分区属性设置及示例
10.分桶意义和价值
第二单元HQL业务大数据指标统计分析
1.分区表与分桶表
2.关联表数据查询
3.常用内置函数                                             
4.累计计算窗口函数(count,sum,min,max)                                           
5.排序窗口函数row_number() over()、rank()、over()                                 
6.偏移分析函数lag() over()、lead() over()
7.复杂数据类型array示例、map例、struct示例
8.嵌套数据类型
9.排名函数/窗口函数详解
10.自定义函数
第三单元                   HQL大数据查询优化
1.Group by替换Distinct去重                                           
2.Grouping sets、cube、rollup 聚合技巧                                          
3.使用Lateral view进行行转列
4.数据倾斜的原因及解决办法
5.文件读取/解析的方式指定ROW FORMAT
6.序列化和反序列化
7.Hive文件存储及属性设置
8.Hive视图、日志和运行方式
9.Hive企业级调优
第四单元实战项目  
用户活跃与画像
一、业务场景:统计平台销售情况
二、灯塔指标:
    1.下单用户数,订单量, GMV,客单价,取消订单量,订单取消率,退货订单量,商品退货率
    2.GMV 趋势,各渠道GMV趋势
    3. 购买频次,订单金额分布
三、分析方法:
    1.SWOT/态势分析法
    2.汇总统计
    3.对比分析
    4.分组分析
    5.确定指标计算口径
四、使用工具:HQL
五、可视化分析:饼图,环图,折线图,漏斗图
六、结论:
    1. 数据获取
    2. 支持可视化和分析

第四阶段:商务智能BI数据分析&BI可视化

第一单元Tableau数据可视化
1.Tableau简介与入门知识
2.Tableau数据源与数据处理
3.Tableau工作表仪表板、故事创建及区别与联系
4.Tableau 组、集、参数创建
5.Tableau离线与实时数据展示 
6.条形图、折线图、热力图、词云图等图形绘制
7.桑吉图、动态图、瀑布图、组合图等图形绘制                                 
8.Tableau地图可视化
9.Tableau的一些高级操作:表计算、创建字段、创建参数、聚合计算
10.新的互动形式——集值set actions
11.Tableau可视化数据地图分组操作
第二单元 Power BI数据报表可视化                        
1.Quick BI简介                                     
2.Quick BI管理控制台操作
3.Quick BI数据源与数据处理
4.Quick BI数据可视化
5.柱图&线图&饼图
6.散点图&雷达图&漏斗图
7.树图&地图&词云图
8.通过现有PowerPivot报告快速上手Power BI
9.Power BI Desktop界面介绍和数据导入整理
10.Power BI Desktop_建立数据分析模型
11.Power BI Desktop_生成企业级可视化报告
12.Power BI和Excel的配合
13.常用可视化图表介绍
第三单元                            实战项目  
1. 推广渠道评估指标体系搭建
2. 电商行业销售分析仪表板(帕累托2/8法则等)
3. 用户增长数据看板
一、业务场景:监测用户关键指标
二、灯塔指标:
    1.各渠道新注册用户数,及购课率,付费用户数,复购用户数。
    2.活跃用户数。
    3.平均购课数。
    4.新注册用户的趋势。
    5.浏览,试看,加购,付款  各环节转化率。
三、分析方法:
    1.SWOT/态势分析法
    2.汇总统计
    3.对比分析
    4.确定指标计算口径
四、使用工具:Excel、Tableau可视化
五、可视化分析:饼图,环图,折线图,漏斗图
六、结论:监测数据,及时发现异常

第五阶段:Python数据分析实战&Python自动化办公

第一单元
Python数据分析编程
1.创建jupyter虚拟环境
2.Tab补全、jupyter快捷键 
3.if、for循环、whlie循环  
4.列表、字符串、元组、集合、字典
5.函数、文件、对象                                            
6.类和对象之间的关系
7.继承中单继承与多继承
8.捕获异常、模块
9.使用自定义模块
10.文件操作、读文件
11.文件打开方式、写文件
第二单元
Numpy科学计算库
1.Ndarray数据类型
2.Ndarray与Python原生list运算率对比
3.创建一维数组、二维数组
4.调整数据组形状和常用属性
5.将数组转为List
6.Numpy数据类型
7.数组索引、切片和数组数值修改
8.数组添加、删除和去重
9.Numpy计算
10.数组拼接、分割
11.数组中nan和inf
12.二维数组转置
第三单元Pandas数据分析库
1.Series与DateFrame数据结构
2.Pandas数据结构介绍
3.Series与DataFrame对象
4.DataFrame对象常用属性
5.Fataframe修改index、columns 
6.本地数据的读取
7.缺失值、重复值、异常值处理
8.多层索引、时间序列、分组聚合
9.Group by机制对业务数据进行聚合与分组操作
10.数据处理、合并和多层索引
11.时间序列、分组聚合和分组
第四单元Matplotlib数据绘图
1.Matplotlib数据可视化
2.高频图像种类场景
3.实现Matplotlib画图
4.折线图绘制、颜色、形状和样式
5.设置图片大小及保存
6.绘制X轴和Y轴刻度
7.一图多个坐标系子图
8.设置坐标轴范围
9.改变坐标轴默认显示方式
10.绘制散点图、设置图像大小及图例
11.绘制条形图及横向条形图
12.并列及罗列条形图
13.绘制饼状图
第五单元                      Python自动化办公
1.Python控制Excel实现自动化办公
2.Python控制WORD实现自动化办公
3.Python控制PDF实现自动化办公
4.Python控制邮件实现自动化办公
5.Python控制报表实现自动化办公
第六单元Python数据分析综合项目                      
1.Python文本数据分析
2.探索性数据分析
3.电商高潜用户预测
4.Python构建用户画像体系
6.Python能源建筑预测报告

第六阶段数据分析综合项目实战

第一单元项目实战大促用户消费购买力分析
第二单元项目实战
全民消费品趋势分析
第三单元项目实战
用户全链路体系构建
第四单元项目实战
大促地域销售预测分析
第五单元项目实战
服饰类超级活动流量来源分析
第六单元项目实战
品牌及竞品用户全链路分析
第七单元 项目实战
电商生态人群聚类
第八单元 项目实战
大促下单时段偏好分析
第九单元 项目实战
服饰全年销售趋势分析
第十单元 项目实战                            
毛衣偏好趋势分析
第十一单元                             项目实战
销售监控分析

第七阶段:数据分析师&统计学分析

第一单元
描述统计&总体推断
1.统计学数据类型划分
2.Mean/均值、Mode/众数、Quantile/四分位数、Variance/方差
3.Standard/标准差、Z-score/标准分数、Skwness/偏度、Kurtosis/峰度
4.从集中趋势,离散程度,分布形态三方面描述数据
5.不同抽样方法优劣比较与使用场景
6.总体 、样本、 抽样三大不同性质分布 
第二单元

抽样调查后推断总体情况

(参数估计、假设检验)

1.参数估计与假设检验
2.通过样本推断总体的方法与理论依据
3.估计量与估计值
4.点估计与区间估计
5.总体区间估计
6.假设表达式
7.假设检验两类错误
8.假设检验流程
9.A/B Test
第三单元

筛选影响结果的关键性因素

(方差分析,列联分析,相关分析)          

1.分类型数据与分类型数据关系度量(列联分析,独立性检验)
2.连续型数据与分类型数据关系度量(T检验,方差分析)
3.连续型数据与连续型数据关系度量 (相关分析)
4.数据类型
5.方差分析类型
6.正态性检验
7.方差齐检验
8.不满足方差齐性
9.方差分析、T检验、卡方分析区别
第四单元

判断事件是否含有季节、周期性变化

(时间序列各因素拆解)

1.时间序列数据的分析方法(移动平均,指数平滑,因素拆解等)
2.传统时序建模方法
3.现代预测方法
4.序列自相关性
5.时间序列基本规则法-周期因子法
第五单元                    项目实战
产品迭代A/B Test
一、业务场景:为合理安排库存,需对下个月的销量进行预测。
二、灯塔指标:
1.统计以往个月销量
2.平滑掉运营活动影响
3.计算出运营活动对销量影响的系数
三、分析方法:时间序列预测 * 影响系数
四、使用工具:统计学工具
五、可视化分析:趋势图
六、结论:给出预测数量和估计区间

八阶段:复杂业务问题&数据挖掘算法实战

第一单元算法建模进行数据分析
1.解析各算法基本函数、目标函数和最优函数
2.从数据清洗到探索性数据分析(EDA)
3.如何建立多种基础模型,如何选择最优算法
4.通过提升模型精度来展示结果
第二单元     高级课题—数据挖掘算法                                        
1.KNN/K-近邻算法
2.朴素贝叶斯算法
3.最小二乘法
4.MLE/极大似然估计算法
5.特征工程
6.探索性数据分析
7.线性回归算法
8.逻辑回归算法
9.梯度下降算法
10.决策树算法
11.随机森林算法
12.聚类算法/K-Means
第三单元                           实战项目
1.  逾期还款业务分析 - 逻辑回归算法
2.  用户流失预警 - KNN算法、SVM算法
3.  随机森林算法填充缺失值
一、业务场景:增大用户池的方法除用户引流外,就是控制用户流失,针对同状态的用户采取不同的运营方案,进行唤醒激活挽回等
二、灯塔指标:
    1.刻画以往行为,访问平均间隔,最大间隔, 访问时长
    2.最后一次访问距窗口期间隔长,消费金额,消费频次,消费优惠占比
三、分析方法:特征工程,逻辑回归,朴素贝叶斯等
四、使用工具:统计学、数据挖掘
五、可视化分析:饼图, 环形图
六、结论:
    1.给出各用状态(活跃,睡眠,流失)
    2.对不同用户采取不同方案



相关课程推荐:

大数据开发工程师

大数据架构师

Java资深研发工程师

P7架构师

百万架构师

全栈大数据分析师


attachments-2020-07-a0ZGVL0T5f164ff7339f0.png

领取免费资料,请添加微信公众号或QQ开发者社区交流群

  • 发表于 2020-07-20 19:07
  • 阅读 ( 490 )

0 条评论

请先 登录 后评论
奈学教育
奈学教育

官方

137 篇文章

作家榜 »

  1. NX小编 1158 文章
  2. 58沈剑 309 文章
  3. 奈学教育 137 文章
  4. 李希沅 | 奈学教育 36 文章
  5. 江帅帅 | 奈学教育 29 文章
  6. 林淮川 | 奈学教育 12 文章
  7. 科技热点 10 文章
  8. 邱鹏超 2 文章