Python机器学习经典实例pdf

摘要

用火的Python语言、通过各种各样的机器学习算法来解决实际问题!书中介绍的主要问题如下。  
– 探索分类分析算法并将其应用于收入等级评估问题  
– 使用预测建模并将其应用到实际问题中  
– 了解如何使用无监督学习来执行市场细分  
– 探索数据可视化技术以多种方式与数据进行交互  
– 了解如何构建推荐引擎  
– 理解如何与文本数据交互并构建模型来分析它  
– 使用隐马尔科夫模型来研究语音数据并识别语音

Python机器学习经典实例 内容简介

在如今这个处处以数据驱动的世界中,机器学习正变得越来越大众化。它已经被广泛地应用于不同领域,如搜索引擎、机器人、无人驾驶汽车等。本书首先通过实用的案例介绍机器学习的基础知识,然后介绍一些稍微复杂的机器学习算法,例如支持向量机、极-端随机森林、隐马尔可夫模型、条件随机场、深度神经网络,等等。

Python机器学习经典实例 目录

第1章监督学习

1.1简介

1.2数据预处理技术

1.2.1准备工作

1.2.2详细步骤

1.3标记编码方法

1.4创建线性回归器

1.4.1准备工作

1.4.2详细步骤

1.5计算回归准确性

1.5.1准备工作

1.5.2详细步骤

1.6保存模型数据

1.7创建岭回归器

1.7.1准备工作

1.7.2详细步骤

1.8创建多项式回归器

1.8.1准备工作

1.8.2详细步骤

1.9估算房屋价格

1.9.1准备工作

1.9.2详细步骤

1.10计算特征的相对重要性

1.11评估共享单车的需求分布

1.11.1准备工作

1.11.2详细步骤

1.11.3更多内容

第2章创建分类器

2.1简介

2.2建立简单分类器

2.2.1详细步骤

2.2.2更多内容

2.3建立逻辑回归分类器

2.4建立朴素贝叶斯分类器

2.5将数据集分割成训练集和测试集

2.6用交叉验证检验模型准确性

2.6.1准备工作

2.6.2详细步骤

2.7混淆矩阵可视化

2.8提取性能报告

2.9根据汽车特征评估质量

2.9.1准备工作

2.9.2详细步骤

2.10生成验证曲线

2.11生成学习曲线

2.12估算收入阶层

第3章预测建模

3.1简介

3.2用SVM建立线性分类器

3.2.1准备工作

3.2.2详细步骤

3.3用SVM建立非线性分类器

3.4解决类型数量不平衡问题

3.5提取置信度

3.6寻找最优超参数

3.7建立事件预测器

3.7.1准备工作

3.7.2详细步骤

3.8估算交通流量

3.8.1准备工作

3.8.2详细步骤

第4章无监督学习——聚类

4.1简介

4.2用k—means算法聚类数据

4.3用矢量量化压缩图片

4.4建立均值漂移聚类模型

4.5用凝聚层次聚类进行数据分组

4.6评价聚类算法的聚类效果

4.7用DBSCAN算法自动估算集群数量

4.8探索股票数据的模式

4.9建立客户细分模型

第5章构建推荐引擎

5.1简介

5.2为数据处理构建函数组合

5.3构建机器学习流水线

5.3.1详细步骤

5.3.2工作原理

5.4寻找最近邻

5.5构建一个KNN分类器

5.5.1详细步骤

5.5.2工作原理

5.6构建一个KNN回归器

5.6.1详细步骤

5.6.2工作原理

5.7计算欧氏距离分数

5.8计算皮尔逊相关系数

5.9寻找数据集中的相似用户

5.10生成电影推荐

第6章分析文本数据

6.1简介

6.2用标记解析的方法预处理数据

6.3提取文本数据的词干

6.3.1详细步骤

6.3.2工作原理

6.4用词形还原的方法还原文本的基本形式

6.5用分块的方法划分文本

6.6创建词袋模型

6.6.1详细步骤

6.6.2工作原理

6.7创建文本分类器

6.7.1详细步骤

6.7.2工作原理

6.8识别性别

6.9分析句子的情感

6.9.1详细步骤

6.9.2工作原理

6.10用主题建模识别文本的模式

6.10.1详细步骤

6.10.2工作原理

第7章语音识别

7.1简介

7.2读取和绘制音频数据

7.3将音频信号转换为频域

7.4自定义参数生成音频信号

7.5合成音乐

7.6提取频域特征

7.7创建隐马尔科夫模型

7.8创建一个语音识别器

第8章解剖时间序列和时序数据

8.1简介

8.2将数据转换为时间序列格式

8.3切分时间序列数据

8.4操作时间序列数据

8.5从时间序列数据中提取统计数字

8.6针对序列数据创建隐马尔科夫模型

8.6.1准备工作

8.6.2详细步骤

8.7针对序列文本数据创建条件随机场

8.7.1准备工作

8.7.2详细步骤

8.8用隐马尔科夫模型分析股票市场数据

第9章图像内容分析

9.1简介

9.2用OpenCV—Pyhon操作图像

9.3检测边

9.4直方图均衡化

9.5检测棱角

9.6检测SIFT特征点

9.7创建Star特征检测器

9.8利用视觉码本和向量量化创建特征

9.9用极端随机森林训练图像分类器

9.10创建一个对象识别器

第10章人脸识别

10.1简介

10.2从网络摄像头采集和处理视频信息

10.3用Haar级联创建一个人脸识别器

10.4创建一个眼睛和鼻子检测器

10.5做主成分分析

10.6做核主成分分析

10.7做盲源分离

10.8用局部二值模式直方图创建一个人脸识别器

第11章深度神经网络

11.1简介

11.2创建一个感知器

11.3创建一个单层神经网络

11.4创建一个深度神经网络

11.5创建一个向量量化器

11.6为序列数据分析创建一个递归神经网络

11.7在光学字符识别数据库中将字符可视化

11.8用神经网络创建一个光学字符识别器

第12章可视化数据

12.1简介

12.2画3D散点图

12.3画气泡图

12.4画动态气泡图

12.5画饼图

12.6画日期格式的时间序列数据

12.7画直方图

12.8可视化热力图

12.9动态信号的可视化模拟

Python机器学习经典实例 精彩文摘

1.4.2 详细步骤

假设你已经创建了数据文件data_singlevar.txt,文件里用逗号分隔符分割字段,第一个字段是输入值,第二个字段是与逗号前面的输入值相对应的输出值。你可以用这个文件作为输入参数。

(1) 创建一个Python文件regressor.py,然后在里面增加下面几行代码:

import sys

import numpy as np

filename = sys.argv[1]

X = []

y = []

with open(filename, 'r') as f:

for line in f.readlines():

xt, yt = [float(i) for i in line.split(',')]

X.append(xt)

y.append(yt)

把输入数据加载到变量X和y,其中X是数据,y是标记。在代码的for循环体中,我们解析每行数据,用逗号分割字段。然后,把字段转化为浮点数,并分别保存到变量X和y中。

(2) 建立机器学习模型时,需要用一种方法来验证模型,检查模型是否达到一定的满意度(satisfactory level)。为了实现这个方法,把数据分成两组:训练数据集(training dataset)与测试数据集(testing dataset)。训练数据集用来建立模型,测试数据集用来验证模型对未知数据的学习效果。因此,先把数据分成训练数据集与测试数据集:

num_training = int(0.8 * len(X))

num_test = len(X) - num_training

# 训练数据

X_train = np.array(X[:num_training]).reshape((num_training,1))

y_train = np.array(y[:num_training])

# 测试数据

X_test = np.array(X[num_training:]).reshape((num_test,1))

y_test = np.array(y[num_training:])

这里用80%的数据作为训练数据集,其余20%的数据作为测试数据集。

图书网:Python机器学习经典实例pdf

继续阅读

→→→→→→→→→→→→→→→→→→→→查找获取

程序设计

重构 改善既有代码的设计(中文版)pdf

《重构:改善既有代码的设计》(中文版)所提的这些重构准则将帮助你一次一小步地修改你的代码,这就减少了过程中的风险。很快你就会把这些重构准则和其名称加入自己的开发词典中,并且朗朗上口...
程序设计

数据结构 C语言版 第2版pdf

适读人群 :普通高校电子信息大类本科生学习、考研,同时也适合零售和培训。 采用“案例驱动”的编写模式。书中结合实际应用,将各章按照“案例引入——数据结构及其操作——案例分析与实现”...
匿名

发表评论

匿名网友

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: