Spark SQL入门与实践指南epub

图书网 2020年2月12日12:05:33
评论
2.1K
摘要

适读人群 :Spark初学者、Spark数据分析人员以及Spark程序开发人员
(1)讲解Spark SQL背景知识、编程基础
(2)通过一个工程实例让读者领略Spark SQL强大简便的分析能力
(3)学习构建一个大数据实际应用的方法,加强工程思维
(4)洞悉Spark的调优方式及其思想,让Spark SQL程序高效运行

Spark SQL入门与实践指南 作者:纪涵,靖晓文,赵政达

Spark SQL入门与实践指南 出版社: 清华大学出版社

Spark SQL入门与实践指南 内容简介

Spark SQL是 Spark大数据框架的一部分,支持使用标准SQL查询和HiveQL来读写数据,可用于结构化数据处理,并可以执行类似SQL的Spark数据查询,有助于开发人员更快地创建和运行Spark程序。

全书分为4篇,共9章,第一篇讲解了Spark SQL 发展历史和开发环境搭建。第二篇讲解了Spark SQL 实例,使得读者掌握Spark SQL的入门操作,了解Spark RDD、DataFrame和DataSet,并熟悉 DataFrame 各种操作。第三篇讲解了基于WiFi探针的商业大数据分析项目,实例中包含数据采集、预处理、存储、利用Spark SQL 挖掘数据,一步一步带领读者学习Spark SQL强大的数据挖掘功能。第四篇讲解了Spark SQL 优化的知识。

本书适合Spark初学者、Spark数据分析人员以及Spark程序开发人员,也适合高校和培训学校相关专业的师生教学参考。

Spark SQL入门与实践指南 目录

第一部分 入门篇

第1章 初识Spark SQL

1.1 Spark SQL的前世今生

1.2 Spark SQL能做什么

第2章 Spark安装、编程环境搭建以及打包提交

2.1 Spark的简易安装

2.2 准备编写Spark应用程序的IDEA环境

2.3 将编写好的Spark应用程序打包成jar提交到Spark上

第二部分 基础篇

第3章 Spark上的RDD编程

3.1 RDD基础

3.2 RDD简单实例—wordcount

3.3 创建RDD

3.4 RDD操作

3.5 向Spark传递函数

3.6 常见的转化操作和行动操作

3.7 深入理解RDD

3.8 RDD缓存、持久化

3.9 RDD checkpoint容错机制

第4章 Spark SQL编程入门

4.1 Spark SQL概述

4.2 Spark SQL编程入门示例

第5章 Spark SQL的DataFrame操作大全

5.1 由JSON文件生成所需的DataFrame对象

5.2 DataFrame上的行动操作

5.3 DataFrame上的转化操作

第6章 Spark SQL支持的多种数据源

6.1 概述

6.2 典型结构化数据源

第三部分 实战篇

第7章 Spark SQL工程实战之基于WiFi探针的商业大数据分析技术

7.1 功能需求

7.2 系统架构

7.3 功能设计

7.4 数据库结构

7.5 本章小结

第8章 第一个Spark SQL应用程序

8.1 完全分布式环境搭建

8.2 数据清洗

8.3 数据处理流程

8.4 Spark程序远程调试

8.5 Spark的Web界面

8.6 本章小结

第四部分 优化篇

第9章 让Spark程序再快一点

9.1 Spark执行流程

9.2 Spark内存简介

9.3 Spark的一些概念

9.4 Spark编程四大守则

9.5 Spark调优七式

9.6 解决数据倾斜问题

9.7 Spark执行引擎Tungsten简介

9.8 Spark SQL解析引擎Catalyst简介

9.9 本章小结

Spark SQL入门与实践指南 精彩文摘

什么是RDD?

RDD即弹性分布式数据集(Resilient Distributed Datasets),是Spark对数据的核心抽象,也就意味着在Spark上进行数据挖掘首先需要将待处理数据源转化成RDD,在此RDD上进行操作。

图书网:Spark SQL入门与实践指南epub

继续阅读

→→→→→→→→→→→→→→→→→→→→查找获取

数据库

Kali Linux & BackTrack渗透测试实战pdf

本书基于编写团队的实际经验,围绕渗透测试进行了全面介绍,并选择“Kali Linux(包含BackTrack)” Live CD作为讲解工具。下载BackTrack Live CD和Kali Linu...
数据库

SQL进阶教程pdf

数据库工程师进阶中级实用指南 挖掘SQL常见技术的新用法 基于标准SQL编写 示例程序均可下载 本书适合具有一定SQL编程经验的工程师阅读 本书特色 1.转变面向过程语言的思维定式,学习SQL常见技术...
数据库

锋利的SQLpdf

锋利的SQL 作者:张洪举 锋利的SQL 出版社:人民邮电出版社 锋利的SQL 内容简介 《锋利的SQL》从基础、开发、性能调整和实战4个方面介绍了SQL技术及其应用,包括数据库管理、表管理、索引管理...
匿名

发表评论

匿名网友

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: