Python 3爬虫 数据清洗与可视化实战epub

图书网 2021年5月27日20:37:36142.2K4

Python 3爬虫 数据清洗与可视化实战 作者:零一,韩要宾,黄园园

Python 3爬虫 数据清洗与可视化实战 出版社:电子工业出版社

Python 3爬虫 数据清洗与可视化实战 内容简介

本书是一本通过实战教初学者学习采集数据、清洗和组织数据进行分析及可视化的 Python 读物。书中案例均经过实战检验,笔者在实践过程中深感采集数据、清洗和组织数据的重要性,作为一名数据行业的“码农”,数据就是沃土,没有数据,我们将无田可耕。

本书共分 11 章, 6 个核心主题:其一是 Python 基础入门,包括环境配置、基本操作、数据类型、语句和函数;其二是 Python 爬虫的构建,包括网页结构解析、爬虫流程设计、代码优化、效率优化、容错处理、 反防爬虫、 表单交互和模拟页面点击; 其三是 Python 数据库应用, 包括 MongoDB、 MySQL 在 Python中的连接与应用;其四是数据清洗和组织,包括 NumPy 数组知识、 pandas 数据的读写、分组变形、缺失值异常值处理、时序数据处理和正则表达式的使用;其五是综合应用案例,帮助读者贯穿爬虫、数据清洗与组织的过程;最后是数据可视化,包括 Matplotlib 和 Pyecharts 两个库的使用,涉及饼图、柱形图、线图、词云图、地图等图形,帮助读者进入可视化的殿堂。

本书以实战为主,适合 Python 初学者及高等院校的相关专业学生,也适合 Python 培训机构作为实验教材使用。

Python 3爬虫 数据清洗与可视化实战 目录

前言

第1章 Python 基础

1.1 安装 Python 环境

1.1.1 Python 3.6.2 安装与配置

1.1.2 使用 IDE 工具——PyCharm

1.1.3 使用 IDE 工具——Anaconda

1.2 Python 操作入门

1.2.1 编写第一个 Python 代码

1.2.2 Python 基本操作

1.2.3 变量

1.3 Python数据类型

1.3.1 数字

1.3.2 字符串

1.3.3 列表

1.3.4 元组

1.3.5 集合

1.3.6 字典

1.4 Python 语句与函数

1.4.1 条件语句

1.4.2 循环语句

1.4.3 函数

第2章 写一个简单的爬虫

2.1 关于爬虫的合法性

2.2 了解网页

2.2.1 认识网页结构

2.2.2 写一个简单的 HTML

2.3 使用 requests 库请求网站

2.3.1 安装 requests 库

2.3.2 爬虫的基本原理

2.3.3 使用 GET 方式抓取数据

2.3.4 使用 POST 方式抓取数据

2.4 使用 Beautiful Soup 解析网页

2.5 清洗和组织数据

2.6 爬虫攻防战

第3章 用 API 爬取天气预报数据

3.1 注册免费 API 和阅读技术文档

3.2 获取 API 数据

3.3 存储数据到 MongoDB

3.3.1 下载并安装 MongoDB

3.3.2 在 PyCharm 中安装 Mongo Plugin

3.3.3 将数据存入 MongoDB

3.4 MongoDB 数据库查询

第4章 大型爬虫案例:抓取某电商网站的商品数据

4.1 观察页面特征和解析数据

4.2 工作流程分析

4.3 构建类目树

4.4 获取产品列表

4.5 代码优化

4.6 爬虫效率优化

4.7 容错处理

第5章 Scrapy 爬虫

5.1 Scrapy 简介

5.2 Scrapy 安装

5.3 案例:用 Scrapy 抓取股票行情

第6章 Selenium 爬虫

6.1 Selenium 简介

6.2 案例:用 Selenium 抓取电商网站数据

第7 章数据库连接和查询

7.1 使用 PyMySQL

7.1.1 连接数据库

7.1.2 案例:某电商网站女装行业 TOP100 销量数据

7.2 使用 SQLAlchemy

7.2.1 SQLAlchemy 基本介绍

7.2.2 SQLAlchemy 基本语法

7.3 MongoDB

7.3.1 MongoDB 基本语法

7.3.2 案例:在某电商网站搜索“连衣裙”的商品数据

第8章 NumPy

8.1 NumPy 简介

8.2 一维数组

8.2.1 数组与列表的异同

8.2.2 数组的创建

8.3 多维数组

8.3.1 多维数组的高效性能

8.3.2 多维数组的索引与切片

8.3.3 多维数组的属性

8.4 数组的运算

第9章 pandas 数据清洗

9.1 数据读写、选择、整理和描述

9.1.1 从 CSV 中读取数据

9.1.2 向 CSV 写入数据

9.1.3 数据选择

9.1.4 数据整理

9.1.5 数据描述

9.2 数据分组、分割、合并和变形

9.2.1 数据分组

9.2.2 数据分割

9.2.3 数据合并

9.2.4 数据变形

9.2.5 案例:旅游数据的分析与变形

9.3 缺失值、异常值和重复值处理

9.3.1 缺失值处理

9.3.2 检测和过滤异常值

9.3.3 移除重复数据

9.3.4 案例:旅游数据的值检查与处理

9.4 时序数据处理

9.4.1 日期/时间数据转换

9.4.2 时序数据基础操作

9.4.3 案例:天气数据分析与处理

9.5 数据类型转换

9.6 正则表达式

9.6.1 元字符与限定符

9.6.2 案例:用正则表达式提取网页文本信息

第10章 综合应用实例

10.1 按性价比给用户推荐旅游产品

10.1.1 数据采集

10.1.2 数据清洗、建模

10.2 通过热力图分析为用户提供出行建议

10.2.1 某旅游网站热门景点爬虫代码(qunaer_sights.py)

10.2.2 提取 CSV 文件中经纬度和销量信息

10.2.3 创建景点门票销量热力地图 HTML 文件

第11章 数据可视化

11.1 matplotlib

11.1.1 画出各省份平均价格、各省份平均成交量柱状图

11.1.2 画出各省份平均成交量折线图、柱状图、箱形图和饼图

11.1.3 画出价格与成交量的散点图

11.2 pyecharts

11.2.1 Echarts 简介

11.2.2 pyecharts 简介

11.2.3 初识 pyecharts,玫瑰相送

11.2.4 pyecharts 基本语法

11.2.5 基于商业分析的 pyecharts 图表绘制

11.2.6 使用 pyecharts 绘制其他图表

11.2.7 pyecharts 和 Jupyter

图书网:Python 3爬虫 数据清洗与可视化实战epub

继续阅读

→→→→→→→→→→→→→→→→→→→→查找获取

人在职场

面试沟通巧技能pdf

适读人群 :本书可为广大求职者面试提供有益指导,也适合作为各层次毕业生找工作的指导用书。 面试,实质是沟通!谁掌握了面试沟通的巧技能,谁就获得了面试的致胜法宝。本书讲述了求职者在面...
人工智能

深度学习之PyTorch实战计算机视觉pdf

适读人群 :本书面向对深度学习技术感兴趣,但是相关基础知识较为薄弱或者零基础的读者。 作者的文笔很好,对深度学习、Python、PyTorch、神经网络、迁移学习及相关数学知识讲解...
项目管理IT人文

关键链pdf

关键链 作者: 艾利·高德拉特 译者: 罗嘉颖 关键链 出版社: 电子工业出版社 关键链 内容简介 《关键链(修订本)》内容简介:项目无处不在.但都有一定的特征:可动用的资源有限;有完成日期及开支限制...
匿名

发表评论

匿名网友

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

评论:14   其中:访客  14   博主  0
    • 群主
      群主 9

      本书是一本通过实战教初学者学习采集数据、清洗和组织数据进行分析及可视化的 Python 读物。书中案例均经过实战检验,笔者在实践过程中深感采集数据、清洗和组织数据的重要性,作为一名数据行业的“码农”,数据就是沃土,没有数据,我们将无田可耕。

      • 默默
        默默 1

        学习一下 学习一下 学习一下

        • 默默
          默默 1

          通信工程师是指能在通信领域中从事研究、设计、制造、运营以及在国民经济各部门和国防工业中从事开发、应用通信技术与设备的高级工程技术人才。

          • wrgws
            wrgws 9

            不错

            • 浮世清欢稚初
              浮世清欢稚初 9

              看看

              • 罢了.
                罢了. 0

                其实我感觉还是挺好的这个书,可以教会很多东西

                • cc
                  cc 0

                  对小白来说太友好了,python小白就需要这么一本书

                  • ...
                    ... 1

                    很好的书,想学很久了

                    • v
                      v 9

                      看看

                      • FF`SS
                        FF`SS 0

                        慕名而来,兴盛而致,所谓好书,直冲云霄 :wink: