R语言数据分析项目精解 理论 方法 实战 作者:罗荣锦
R语言数据分析项目精解 理论 方法 实战 出版社:电子工业出版社
R语言数据分析项目精解 理论 方法 实战 内容简介
本书以互联网电商企业为背景,抽象出工作中常见的数据分析问题,利用 R 语言和统计学列出了详细的解决方案和过程。本书共 9 章,前两章分别为总论和 R 语言入门知识,之后各章分别介绍了运营指标的建立、指标监控系统、假设检验及 AB 测试、变量筛选技术、用户画像系统、寻找优质用户和文本挖掘等内容。本书涉及到的统计方法有:指标增长幅度量化方法、层次分析法、时间序列模型、基于正态分布的一元离群点检验、傅里叶谱分析、假设检验、主成分分析、因子分析、模糊聚类、无监督下连续型变量离散化、逻辑回归模型和文本挖掘等。另外,本书提供了所有实例的 R 语言实现代码,总计 33 个自定义函数和数千行代码。本书适合数据分析从业人员、产品运营人员、统计专业学生和 R 语言爱好者阅读。
R语言数据分析项目精解 理论 方法 实战 目录
前言
第1章 互联网+统计学+R语言
1.1 互联网中的统计学
1.1.1 “互联网+”的发展
1.1.2 统计学的发展
1.1.3 大数据时代的统计学
1.2 R语言——互联网与统计学的桥梁
1.3 本书结构
第2章 R语言基础
2.1 安装R语言
2.1.1 获取和安装R语言
2.1.2 安装RStudio
2.1.3 R包
2.1.4 帮助
2.2 R语言基本对象
2.2.1 数据类型
2.2.2 向量
2.2.3 矩阵和数组
2.2.4 列表
2.2.5 数据框
2.2.6 因子
2.2.7 数据类型的辨别和转换
2.2.8 数据类型和对象关系
2.3 工作空间和查看对象
2.3.1 工作空间和工作目录
2.3.2 遍历、创建、删除文件夹
2.3.3 查看对象的方法
2.4 数据导入和导出
2.4.1 数据导入
2.4.2 数据导出
2.5 操作符和函数
2.5.1 操作符
2.5.2 函数
2.6 数据集操作
2.6.1 变量操作
2.6.2 数据集操作
2.6.3 数据集连接
2.6.4 数据汇总
2.7 控制流
2.7.1 重复和循环
2.7.2 条件执行
2.7.3 next和break
2.8 自定义函数
第3章 互联网运营指标的建立
3.1 项目背景、目标及方案
3.1.1 项目背景
3.1.2 项目目标
3.1.3 项目方案
3.2 项目技术理论简介
3.2.1 骨灰级流量指标
3.2.2 登录和激活
2.2.3 访问深度和吸引力
3.2.4 订单指标
3.2.5 网站或APP性能指标
3.2.6 转化率
3.2.7 层次分析法
3.3 项目实践
3.3.1 搭建运营指标系统
3.3.2 制作对比型指标及趋势线
3.3.3 创建用户价值和活跃度指标
第4章 指标监控系统
4.1 项目背景、目标及方案
4.1.1 项目背景
4.1.2 项目目标
4.1.3 项目方案
4.2 项目技术理论简介
4.2.1 时间序列基本统计量
4.2.2 数据观测与描述性统计
4.2.3 随机性
4.2.4 周期性
4.2.5 节假日模式识别
4.2.6 建模数据集的建立
4.2.7 指标监控方法(不含节假日)
4.2.8 节假日指标监控方法
4.2.9 R语言实例代码
4.3 项目实践
4.3.1 数据概览
4.3.2 节假日模式识别
4.3.3 模型数据集的建立
4.3.4 指标监控(非节假日)
4.3.5 节假日指标监控
4.3.6 总结
第5章 用数据驱动业务——AB测试
5.1 项目背景、目标和方案
5.1.1 项目背景
5.1.2 项目目标
5.1.3 项目方案
5.2 项目技术理论简介
5.2.1 自动化分流策略
5.2.2 整体评估指标
5.2.3 概率论预备知识
5.2.4 假设检验
5.2.5 三个问题
5.3 项目实践
第6章 变量筛选技术
6.1 项目背景、目标和方案
6.1.1 项目背景
6.1.2 项目目标
6.1.3 项目方案
6.2 项目技术理论简介
6.2.1 变量相关性
6.2.2 变量筛选
6.2.3 变量降维
6.2.4 R语言实例代码
6.3 项目实践
6.3.1 变量筛选
6.3.2 变量降维
第7章 构建用户画像系统
7.1 项目背景、目标和方案
7.1.1 项目背景
7.1.2 项目目标
7.1.3 项目方案
7.2 项目技术理论简介
7.2.1 用户画像的基本概念
7.2.2 用户画像应用领域
7.2.3 用户画像分类
7.2.4 用户画像构建
7.2.5 用户画像标签的数值处理方法
7.3 项目实践
第8章 从数据中寻找优质用户
8.1 项目背景、目标和方案
8.1.1 项目背景
8.1.2 项目目标
8.1.3 项目方案
8.2 项目技术理论简介
8.2.1 逻辑回归的基本概念
8.2.2 建模流程
8.2.3 模型开发阶段
8.2.4 模型验证阶段
8.2.5 模型测试阶段
8.2.6 商业应用流程
8.2.7 R语言实例代码
8.3 项目实践
8.3.1 数据探索
8.3.2 数据处理
8.3.3 建立模型
8.3.4 模型验证
8.3.5 总结
第9章 文本挖掘——点评数据展示策略
9.1 项目背景、目标和方案
9.1.1 项目背景
9.1.2 项目目标
9.1.3 项目方案
9.2 项目技术理论简介
9.2.1 评论文本质量量化指标模型
9.2.2 用户相似度模型
9.2.3 情感性分析
9.2.4 R语言实例代码
9.3 项目实践
9.3.1 若干自定义函数
9.3.2 文本质量量化指标模型
9.3.3 用户相似度模型
9.3.4 情感性分析
9.3.5 总结
R语言数据分析项目精解 理论 方法 实战 精彩文摘
4.1.1 项目背景
还记得第3 章中那个运营团队负责人吗?在数据分析团队花了几周时间制定运营指标体系,并且制作了趋势线指标及用户价值和活跃度之后,一天上午他又气呼呼地跑到数据分析总监的办公室抱怨:每天查看运营分析报告简直是一件令人头疼的事情,指标太多了,并且一时间难以有效察觉问题;另外,他想知道未来可能的情况,以便可以提前做准备。数据分析总监听后找来了数据分析经理,把需求阐述了一遍。数据分析经理领命后又一次陷入沉思,线上指标数量庞大,每天通过肉眼一个一个地跟踪确实耗费大量的人力成本和精力,效率极其低下,若可以针对重要指标制定一套自动报警机制,把每天有异常的指标自动输出,则可以有效降低人力成本。另外,运营团队负责人需要对未来的情况有一个了解,这就需要通过历史数据对未来进行预测。于是,数据分析经理制定了项目目标。
4.1.2 项目目标
针对重要指标建立预测模型,通过预测模型的95%预测上下限建立监控范围。这样就可以一举两得,预测模型可以对未来进行预估,另外95%上下限建立的范围可以用于监控,若当天数值超出当天预测值的监控范围,则报警。最后,通过可视化工具前端展示整个需求就可以了。
4.1.3 项目方案
目标制定后,需要找出一套有效的技术手段来实施,经过团队讨论和调研,最终选择使用时间序列模型对指标进行预测,并且确定了监控系统技术流程,如图4.1 所示。
→→→→→→→→→→→→→→→→→→→→查找获取
2020年6月18日 上午11:29 1F
谢谢分享
2020年7月7日 下午2:04 2F
谢谢分享