统计学习导论 基于R应用pdf

图书网 2018年8月29日09:03:28276.5K

统计学习导论 基于R应用 内容简介

统计学习是一套以复杂数据建模和数据理解为目的的工具集,是近期才发展起来的统计学的一个新领域。本书出自统计学习领域声名显赫的几位专家,结合R语言介绍了分析大数据必不可少的工具,提供一些重要的建模和预测技术,并借助丰富的实验来解释如何用R语言实现统计学习方法。论题包括线性回归、分类、重抽样方法、压缩方法、基于树的方法、支持向量机、聚类等,作者借助彩图和实际案例直观解释这些方法。为了读者更好地理解书中内容,每章后还配有丰富的概念性和应用性练习题。

书中内容与《The Elements of Statistical Learning》的大部分内容相同,但是本书起点低,弱化了数学推导的细节,更注重方法的应用,所以更适合作为入门教材。当然,这本《统计学习导论》不仅是优秀的“统计学习”或“机器学习”课程的教材,也是数据挖掘、数据分析等相关从业者不可或缺的参考书。

统计学习导论 基于R应用 目录

第1章 导论

1.1 统计学习概述

1.2 统计学习简史

1.3 关于这本书

1.4 这本书适用的读者群

1.5 记号与简单的矩阵代数

1.6 本书的内容安排

1.7 用于实验和习题的数据集

1.8 本书网站

1.9 致谢

第2章 统计学习

2.1 什么是统计学习

2.2 评价模型精度

2.3 实验:R语言简介

2.4 习题

第3章 线性回归

3.1 简单线性回归

3.2 多元线性回归

3.3 回归模型中的其他注意事项

3.4 营销计划

3.5 线性回归与K最近邻法的比较

3.6 实验:线性回归

3.7 习题

第4章 分类

4.1 分类问题概述

4.2 为什么线性回归不可用

4.3 逻辑斯谛回归

4.4 线性判别分析

4.5 分类方法的比较

4.6 R实验:逻辑斯谛回归、LDA、QDA和KNN

4.7 习题

第5章 重抽样方法

5.1 交叉验证法

5.2 自助法

5.3 实验:交叉验证法和自助法

5.4 习题

第6章 线性模型选择与正则化

6.1 子集选择

6.2 压缩估计方法

6.3 降维方法

6.4 高维问题

6.5 实验1:子集选择方法

6.6 实验2:岭回归和lasso

6.7 实验3:PCR和PLS回归

6.8 习题

第7章 非线性模型

7.1 多项式回归

7.2 阶梯函数

7.3 基函数

7.4 回归样条

7.5 光滑样条

7.6 局部回归

7.7 广义可加模型

7.8 实验:非线性建模

7.9 习题

第8章 基于树的方法

8.1 决策树基本原理

8.2 装袋法、随机森林和提升法

8.3 实验:决策树

8.4 习题

第9章 支持向量机

9.1 最大间隔分类器

9.2 支持向量分类器

9.3 狭义的支持向量机

9.4 多分类的SVM

9.5 与逻辑斯谛回归的关系

9.6 实验:支持向量机

9.7 习题

第10章 无指导学习

10.1 无指导学习的挑战

10.2 主成分分析

10.3 聚类分析方法

10.4 实验1:主成分分析

10.5 实验2:聚类分析

10.6 实验3:以NCI60数据为例

10.7 习题

统计学习导论 基于R应用 精彩文摘

1.1 统计学习概述

第1章导 论

统计学习(statistical leaming)是一套以理解数据(understanding data)为目的的庞大工具集。统计学习的工具可分为两大类:有指导的( supervised)学习和无指导的(unsupeⅣised)学习。一般而言,有指导的统计学习工具主要有两种用途:一是面向预测的统计模型的建立,二是对一个或多个给定的输入(input)估计某个输出(output)。这两类问题普遍存在于商业、医学、天体物理学以及公共政策等领域。在无指导的统计学习问题中,有输入变量但不指定输出变量,建模的主旨是学习数据的关系和结构。为了给读者一个直观的对统计学习应用的认识,本章首先简要讨论3个来自真实世界的数据例子,有关这些数据的详细讨论将在后面的章节一一展开。

1.1.1 工资数据

第一个应用中(我们将在整本书中用Wage(工资)这个名称表示该数据集),考察与美国中部大西洋地区男性收入相关的几个因素。具体来说,我们希望理解员工的age(年龄)、education(受教育程度)、year(工龄)与其历年wage(工资)的关系。仔细观察一下图1-1,左图绘制了每个人的wage与age的关系图,该图是如下命题的一条直接证据:工龄的前半程,wage随员工age的增长而递增,大约60岁后wage呈明显的下降趋势。曲线给出了每个age点处员工的平均wage估计,更清晰地表达了这种趋势。当给定某雇员的age,可以用这条曲线预测他的wage。然而,同样可以很明显地从图1-1中发现这个平均值具有很大的变差,所以,如果仅仅使用age作为唯一的预测变量则不太可能给出某个人wage的精准预测。

图书网:统计学习导论 基于R应用pdf

继续阅读

→→→→→→→→→→→→→→→→→→→→查找获取

程序设计

重构 改善既有代码的设计(中文版)pdf

《重构:改善既有代码的设计》(中文版)所提的这些重构准则将帮助你一次一小步地修改你的代码,这就减少了过程中的风险。很快你就会把这些重构准则和其名称加入自己的开发词典中,并且朗朗上口...
程序设计

数据结构 C语言版 第2版pdf

适读人群 :普通高校电子信息大类本科生学习、考研,同时也适合零售和培训。 采用“案例驱动”的编写模式。书中结合实际应用,将各章按照“案例引入——数据结构及其操作——案例分析与实现”...
匿名

发表评论

匿名网友

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

评论:27   其中:访客  27   博主  0
    • qimhe
      qimhe 0

      想下载

        • Theodore
          Theodore 0

          @ qimhe 很需要这本书希望可以下载谢谢!

        • @
          @ 0

          想下载

          • jae
            jae 9

            希望是彩版

            • 大楠瓜
              大楠瓜 9

              非常感谢!

              • Jack
                Jack 9

                能不能下载

                • daf@163.com
                  daf@163.com 9

                  想下载

                  • bioone
                    bioone 9

                    这本书很不错的,希望可以下载!

                    • 阿伟
                      阿伟 9

                      好书啊!

                      • tyluo
                        tyluo 9

                        下载

                        • ゛ 橙子你个奥润吉。
                          ゛ 橙子你个奥润吉。 9

                          希望是彩色清晰版