Hadoop大数据开发实战pdf

图书网 2021年9月18日20:53:58
评论
1.2K1

Hadoop大数据开发实战 作者:杨力

Hadoop大数据开发实战 出版社:人民邮电出版社

Hadoop大数据开发实战 内容简介

本书将大数据技术生态圈主流技术框架的应用与发展、搭建Hadoop大数据分布式系统集群平台、大数据分布式文件系统HDFS(Hadoop Distributed File System)、大数据分布式并行计算框架MapReduce、大数据汽车销售数据统计分析项目5大模块分为11章内容进行阐述。具体分布情况如下:第1章是大数据概论,介绍大数据的发展背景及基本概念;第2章是搭建Hadoop分布式集群;第3~6章是HDFS分布式文件系统入门、HDFS接口、HDFS的运行机制、Hadoop I/O流操作;第7~10章是初识MapReduce编程模型、MapReduce应用编程开发、MapReduce编程案例、MapReduce运行机制与YARN平台;第11章是汽车销售数据统计分析项目实战。本书将理论与实践相结合,介绍了大数据的核心技术,并通过介绍一个企业的开发项目,深入讲解大数据技术在实际工作中的应用。

本书是为所有热爱大数据、打算从事大数据相关工作的读者而编写的,适合有Java编程基础的学习者参考使用,也适合作为高等院校、培训机构的大数据技术教材。

Hadoop大数据开发实战 目录

前言

第1章 大数据概论

1.1 大数据的学习基础

1.2 大数据的背景

1.3 对大数据的不同认识

1.4 大数据的行业案例

1.5 大数据的基本概念

1.6 大数据技术生态圈

本章总结

本章习题

第2章 搭建Hadoop分布式集群

2.1 云平台

2.2 安装CentOS 6

2.3 Linux系统配置

2.4 Hadoop的配置部署

本章总结

本章习题

第3章 HDFS入门

3.1 Hadoop分布式文件系统HDFS

3.2 HDFS核心设计

3.3 HDFS体系结构

本章总结

本章习题

第4章 HDFS接口

4.1 HDFS命令行接口

4.2 HDFS Java接口

本章总结

本章习题

第5章 HDFS的运行机制

5.1 HDFS中数据流的读写

5.2 HA机制

5.3 Federation机制

本章总结

本章习题

第6章 Hadoop I/O流操作

6.1 数据完整性

6.2 压缩

6.3 序列化

6.4 基于文件的数据结构SequenceFile

本章总结

本章习题

第7章 初识MapReduce编程模型

7.1 MapReduce编程框架

7.2 WordCount编程实例

7.3 Hadoop MapReduce架构

本章总结

本章习题

第8章 MapReduce应用编程开发

8.1 MapReduce编程开发

8.2 MapReduce在集群上的运作

8.3 MapReduce的类型与格式

本章总结

本章习题

第9章 MapReduce编程案例

9.1 数据去重

9.2 数据排序

9.3 平均成绩

9.4 多表关联

9.5 二次排序

本章总结

本章习题

第10章 MapReduce运行机制与YARN平台

10.1 剖析MapReduce作业运行机制

10.2 Shuffle和排序

10.3 任务的执行

10.4 作业的调度

10.5 YARN平台简介

10.6 YARN平台架构

本章总结

本章习题

第11章 汽车销售数据统计分析项目

11.1 数据概况

11.2 项目实战

本章总结

本章习题

图书网:Hadoop大数据开发实战pdf

继续阅读

→→→→→→→→→→→→→→→→→→→→查找获取

数学

吴军:你最喜欢的数字是什么?《数学之美》PDF

数学之美 作者:吴军 数学之美 出版:人民邮电出版社 数学之美 内容简介 你最喜欢的数字是什么?几年前,“数学之美”系列文章原刊载于谷歌黑板报,获得上百万次点击,得到读者高度评价。读者说,读了“数学之...
匿名

发表评论

匿名网友

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: