精通机器学习 基于R(第2版)pdf

图书网 2018年12月27日20:25:521 3.2K
摘要

本书使用R语言讲述机器学习高 级技术,带领读者深入研究统计学习理论和监督式学习,理解如何设计高效算法,学习构建推荐引擎,运用多类分类和深度学习,等等。通过探索数据挖掘、分类、聚类、回归、预测建模、异常检测等,本书帮助读者理解这些概念的工作原理和能够实现的操作。读者将循序渐进地学习神经网络等主题,探索深度学习等内容。通过不同方式使用不同的数据集,读者还可以在AWS等云平台上利用R亲手实践机器学习。

精通机器学习 基于R(第2版) 内容简介

机器学习是近年来的热门技术话题,R语言是处理其中大量数据的有力工具。本书为读者提供机器学习和R语言的坚实算法基础和业务基础,内容包括机器学习基本概念、线性回归、逻辑回归和判别分析、线性模型的高 级选择特性、K最近邻和支持向量机等,力图平衡实践中的技术和理论两方面。

本书适合试图理解和表述机器学习算法的IT人士、想在分析中发挥R强大威力的统计学专家。即使是同时精通IT技术和统计学的读者,在本书中仍然可以发现一些有用的窍门和技巧。

精通机器学习 基于R(第2版) 目录

第1章 成功之路1

1.1 流程1

1.2 业务理解2

1.2.1 确定业务目标3

1.2.2 现状评估4

1.2.3 确定分析目标4

1.2.4 建立项目计划4

1.3 数据理解4

1.4 数据准备5

1.5 建模5

1.6 评价6

1.7 部署6

1.8 算法流程图7

1.9 小结10

第 2章 线性回归:机器学习基础技术11

2.1 单变量回归11

2.2 多变量线性回归18

2.2.1 业务理解18

2.2.2 数据理解和数据准备18

2.2.3 模型构建与模型评价21

2.3 线性模型中的其他问题30

2.3.1 定性特征30

2.3.2 交互项32

2.4 小结34

第3章 逻辑斯蒂回归与判别分析35

3.1 分类方法与线性回归35

3.2 逻辑斯蒂回归36

3.2.1 业务理解36

3.2.2 数据理解和数据准备37

3.2.3 模型构建与模型评价41

3.3 判别分析概述46

3.4 多元自适应回归样条方法50

3.5 模型选择54

3.6 小结57

第4章 线性模型中的高 级特征选择技术58

4.1 正则化简介58

4.1.1 岭回归59

4.1.2 LASSO59

4.1.3 弹性网络60

4.2 商业案例60

4.2.1 业务理解60

4.2.2 数据理解和数据准备60

4.3 模型构建与模型评价65

4.3.1 最优子集65

4.3.2 岭回归68

4.3.3 LASSO71

4.3.4 弹性网络73

4.3.5 使用glmnet进行交叉验证76

4.4 模型选择78

4.5 正则化与分类问题78

4.6 小结81

第5章 更多分类技术:K最近邻与支持向量机82

5.1 K最近邻82

5.2 支持向量机84

5.3 商业案例86

5.3.1 业务理解86

5.3.2 数据理解和数据准备87

5.3.3 模型构建与模型评价92

5.3.4 模型选择98

5.4 SVM中的特征选择100

5.5 小结101

第6章 分类回归树103

6.1 本章技术概述103

6.1.1 回归树104

6.1.2 分类树104

6.1.3 随机森林105

6.1.4 梯度提升106

6.2 商业案例106

6.2.1 模型构建与模型评价107

6.2.2 模型选择121

6.2.3 使用随机森林进行特征选择121

6.3 小结123

第7章 神经网络与深度学习124

7.1 神经网络介绍124

7.2 深度学习简介128

7.3 业务理解131

7.4 数据理解和数据准备132

7.5 模型构建与模型评价136

7.6 深度学习示例139

7.6.1 H2O背景介绍139

7.6.2 将数据上载到H2O平台140

7.6.3 建立训练数据集和测试数据集141

7.6.4 模型构建142

7.7 小结146

第8章 聚类分析147

8.1 层次聚类148

8.2 K-均值聚类149

8.3 果瓦系数与围绕中心的划分150

8.3.1 果瓦系数150

8.3.2 PAM151

8.4 随机森林151

8.5 业务理解152

8.6 数据理解与数据准备152

8.7 模型构建与模型评价155

8.7.1 层次聚类155

8.7.2 K-均值聚类162

8.7.3 果瓦系数和PAM165

8.7.4 随机森林与PAM167

8.8 小结168

第9章 主成分分析169

9.1 主成分简介170

9.2 业务理解173

9.3 模型构建与模型评价176

9.3.1 主成分抽取176

9.3.2 正交旋转与解释177

9.3.3 根据主成分建立因子得分178

9.3.4 回归分析178

9.4 小结184

第10章 购物篮分析、推荐引擎与序列分析185

10.1 购物篮分析简介186

10.2 业务理解187

10.3 数据理解和数据准备187

10.4 模型构建与模型评价189

10.5 推荐引擎简介192

10.5.1 基于用户的协同过滤193

10.5.2 基于项目的协同过滤194

10.5.3 奇异值分解和主成分分析194

10.6 推荐系统的业务理解198

10.7 推荐系统的数据理解与数据准备198

10.8 推荐系统的建模与评价200

10.9 序列数据分析208

10.10 小结214

第11章 创建集成多类分类215

11.1 集成模型215

11.2 业务理解与数据理解216

11.3 模型评价与模型选择217

11.4 多类分类219

11.5 业务理解与数据理解220

11.6 模型评价与模型选择223

11.6.1 随机森林224

11.6.2 岭回归225

11.7 MLR集成模型226

11.8 小结228

第12章 时间序列与因果关系229

12.1 单变量时间序列分析229

12.2 业务理解235

12.3 模型构建与模型评价240

12.3.1 单变量时间序列预测240

12.3.2 检查因果关系243

12.4 小结249

第13章 文本挖掘250

13.1 文本挖掘框架与方法250

13.2 主题模型252

13.3 业务理解254

13.4 模型构建与模型评价257

13.4.1 词频分析与主题模型257

13.4.2 其他定量分析261

13.5 小结267

第14章 在云上使用R语言268

14.1 创建AWS账户269

14.1.1 启动虚拟机270

14.1.2 启动Rstudio272

14.2 小结274

附录A R语言基础275

精通机器学习 基于R(第2版) 精彩文摘

在大多数(即便不是全部)项目中,成功解决问题或改进决策的关键因素不是算法,而是沟通能力和影响力之类的非定量的软技能。很多人认为其中的问题在于,我们很难量化这些软技能的效果。一般来说,人们遇到不想做的事情都会止步不前。别忘了,爆红的电视喜剧《生活大爆炸》就是这么拍的。所以,本章目的是使你走向成功,意在提供一个流程,至少是一个灵活的流程,使你成为一位 变革推动者:一个不靠位高权重以势压人,而是具有真知灼见并能付诸实施的人。我们将集中讨论 跨行业数据挖掘标准流程(Cross-Industry Standard Process for Data Mining ,CRISP-DM),这可能是最著名也是最受重视的项目分析方法。即使你使用的是其他成熟方法或专有技术,也可以在本章有所收获。

图书网:精通机器学习 基于R(第2版)pdf

继续阅读

→→→→→→→→→→→→→→→→→→→→查找获取

程序设计

重构 改善既有代码的设计(中文版)pdf

《重构:改善既有代码的设计》(中文版)所提的这些重构准则将帮助你一次一小步地修改你的代码,这就减少了过程中的风险。很快你就会把这些重构准则和其名称加入自己的开发词典中,并且朗朗上口...
程序设计

数据结构 C语言版 第2版pdf

适读人群 :普通高校电子信息大类本科生学习、考研,同时也适合零售和培训。 采用“案例驱动”的编写模式。书中结合实际应用,将各章按照“案例引入——数据结构及其操作——案例分析与实现”...
匿名

发表评论

匿名网友

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

评论:1   其中:访客  1   博主  0
    • nononee
      nononee 9

      挺好的