游侠云服务,国外稳定安全免备案的服务器

统一声明:

1.本站联系方式QQ:1754646538 TG:UXYM_NET 没有频道!如果有其他人通过本站链接联系您导致被骗,本站一律不负责!
2.需要付费搭建请联系站长QQ:1754646538 TG:UXYM_NET
3.国外免备案服务器- 游侠云服务
4.免实名域名注册购买- 游侠云域名

资源名称:深入理解大数据:大数据处理与编程实践

内容简介:

以大数据处理主流平台Hadoop1.0为核心,介绍Hadoop MapReduce,HDFS,HBase,以及Hive的基本设计思想、工作原理、系统构架、以及详细的大数据处理编程技术。

  特点:

  (1) 重点放在教读者算法设计实现,从基础算法,到应用编程案例,解决实际问题。

  (2) 作者多年的教学研究实践,课程设计沉淀,可以更深入地讨论大数据。

  (3) 来自业界——Intel真实的实践经验和案例积累。

资源目录:

推荐序一

推荐序二

推荐序三

丛书序言

前言

第一部分Hadoop系统

第1章大数据处理技术简介

1.1并行计算技术简介

1.1.1并行计算的基本概念

1.1.2并行计算技术的分类

1.1.3并行计算的主要技术问题

1.2大数据处理技术简介

1.2.1大数据的发展背景和研究意义

1.2.2大数据的技术特点

1.2.3大数据研究的主要目标、基本原则和基本途径

1.2.4大数据计算模式和系统

1.2.5大数据计算模式的发展趋势

1.2.6大数据的主要技术层面和技术内容

1.3MapReduce并行计算技术简介

1.3.1MapReduce的基本概念和由来

1.3.2MapReduce的基本设计思想

1.3.3MapReduce的主要功能和技术特征

1.4Hadoop系统简介

1.4.1Hadoop的概述与发展历史

1.4.2Hadoop系统分布式存储与并行计算构架

1.4.3Hadoop平台的基本组成与生态系统

1.4.4Hadoop的应用现状和发展趋势

第2章Hadoop系统的安装与操作管理

2.1Hadoop系统安装方法简介

2.2单机和单机伪分布式Hadoop系统安装基本步骤

2.2.1安装和配置JDK

2.2.2创建Hadoop用户

2.2.3下载安装Hadoop

2.2.4配置SSH

2.2.5配置Hadoop环境

2.2.6Hadoop的运行

2.2.7运行测试程序

2.2.8查看集群状态

2.3集群分布式Hadoop系统安装基本步骤

2.3.1安装和配置JDK

2.3.2创建Hadoop用户

2.3.3下载安装Hadoop

2.3.4配置SSH

2.3.5配置Hadoop环境

2.3.6Hadoop的运行

2.3.7运行测试程序

2.3.8查看集群状态

2.4HadoopMapReduce程序开发过程

2.5集群远程作业提交与执行

2.5.1集群远程作业提交和执行过程

2.5.2查看作业执行结果和集群状态

第3章大数据存储–分布式文件系统HDFS

3.1HDFS的基本特征与构架

3.1.1HDFS的基本特征

3.1.2HDFS的基本框架与工作过程

3.2HDFS可靠性设计

3.2.1HDFS数据块多副本存储设计

3.2.2HDFS可靠性的设计实现

3.3HDFS文件存储组织与读写

3.3.1文件数据的存储组织

3.3.2数据的读写过程

3.4HDFS文件系统操作命令

3.4.1HDFS启动与关闭

3.4.2HDFS文件操作命令格式与注意事项

3.4.3HDFS文件操作命令

3.4.4高级操作命令和工具

3.5HDFS基本编程接口与示例

3.5.1HDFS编程基础知识

3.5.2HDFS基本文件操作API

3.5.3HDFS基本编程实例

第4章HadoopMapReduce并行编程框架

4.1MapReduce基本编程模型和框架

4.1.1MapReduce并行编程抽象模型

4.1.2MapReduce的完整编程模型和框架

4.2HadoopMapReduce基本构架与工作过程

4.2.1Hadoop系统构架和MapReduce程序执行过程

4.2.2HadoopMapReduce执行框架和作业执行流程

4.2.3HadoopMapReduce作业调度过程和调度方法

4.2.4MapReduce执行框架的组件和执行流程

4.3HadoopMapReduce主要组件与编程接口

4.3.1数据输入格式InputFormat

4.3.2输入数据分块InputSplit

4.3.3数据记录读入RecordReader

4.3.4Mapper类

4.3.5Combiner

4.3.6Partitioner

4.3.7Sort

4.3.8Reducer类

4.3.9数据输出格式OutputFormat

4.3.10数据记录输出RecordWriter

第5章分布式数据库HBase

5.1HBase简介

5.1.1为什么需要NoSQL数据库

5.1.2HBase的作用和功能特点

5.2HBase的数据模型

5.2.1HBase的基本数据模型

5.2.2HBase的查询模式

5.2.3HBase表设计

5.3HBase的基本构架与数据存储管理方法

5.3.1HBase在Hadoop生态中的位置和关系

5.3.2HBase的基本组成结构

5.3.3HBaseRegion

5.3.4RegionServer

5.3.5HBase的总体组成结构

5.3.6HBase的寻址和定位

5.3.7HBase节点的上下线管理

5.4HBase安装与操作

5.4.1安装一个单机版的HBase

5.4.2HBaseShell操作命令

5.4.3基于集群的HBase安装和配置

5.5HBase的编程接口和编程示例

5.5.1表创建编程接口与示例

5.5.2表数据更新编程接口与示例

5.5.3数据读取编程接口与示例

5.5.4HBaseMapReduce支持和编程示例

5.6HBase的读写操作和特性

5.6.1HBase的数据写入

5.6.2HBase的数据读取

5.7其他HBase功能

5.7.1Coprocessor

5.7.2批量数据导入BulkLoad

第6章分布式数据仓库Hive

6.1Hive的作用与结构组成

6.2Hive的数据模型

6.2.1Hive的数据存储模型

6.2.2Hive的元数据存储管理

6.2.3Hive的数据类型

6.3Hive的安装

6.3.1下载Hive安装包

6.3.2配置环境变量

6.3.3创建Hive数据文件目录

6.3.4修改Hive配置文件

6.4Hive查询语言–HiveQL

6.4.1DDL语句

6.4.2DML语句

6.4.3SELECT查询语句

6.4.4数据表操作语句示例

6.4.5分区的使用

6.4.6桶的使用

6.4.7子查询

6.4.8Hive的优化和高级功能

6.5HiveJDBC编程接口与程序设计

第7章IntelHadoop系统优化与功能增强

7.1IntelHadoop系统简介

7.1.1IntelHadoop系统的主要优化和增强功能

7.1.2IntelHadoop的系统构成与组件

7.2IntelHadoop系统的安装和管理

7.3IntelHadoopHDFS的优化和功能扩展

7.3.1HDFS的高可用性

7.3.2IntelHadoop系统高可用性配置服务

7.3.3IntelHadoop系统高可用性配置服务操作

7.3.4自适应数据块副本调整策略

7.4IntelHadoopHBase的功能扩展和编程示例

7.4.1HBase大对象存储(LOB)

7.4.2加盐表

7.4.3HBase跨数据中心大表

7.5IntelHadoopHive的功能扩展和编程示例

7.5.1开源Hive的不足

7.5.2IntelHadoop"HiveoverHBase"优化设计

7.5.3HiveoverHBase的架构

第二部分MapReduce的编程和算法设计

第8章MapReduce基础算法程序设计

第9章MapReduce高级程序设计技术

第10章MapReduce数据挖掘基础算法

第11章大数据处理算法设计与应用编程案例

附录

附录AOpenMP并行程序设计简介

附录BMPI并行程序设计简介

附录C英特尔ApacheHadoop*系统安装手册

参考文献

资源截图:

深入理解大数据:大数据处理与编程实践
收藏 (0) 打赏

感谢您的支持,我会继续努力的!

打开微信/支付宝扫一扫,即可进行扫码打赏哦,分享从这里开始,精彩与您同在
点赞 (0)

1. 本站所有资源来源于用户上传和网络,因此不包含技术服务请大家谅解!如有侵权请邮件联系客服!17131833@qq.com 2. 本站不保证所提供下载的资源的准确性、安全性和完整性,资源仅供下载学习之用!如有链接无法下载、失效或广告,请联系客服处理,有奖励! 3. 您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容资源!如用于商业或者非法用途,与本站无关,一切后果请用户自负! 4. 如果您也有好的资源或教程,您可以投稿发布,成功分享后有站币奖励和额外收入!

源雷 云计算教程 深入理解大数据:大数据处理与编程实践 https://www.mubanke.com/58075.html

linux教程windows教程云计算大数据

本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。

最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。 若排除这种情况,可在对应资源底部留言,或联络我们。

对于会员专享、整站源码、程序插件、网站模板、网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。

如果您已经成功付款但是网站没有弹出成功提示,请联系站长QQ:1754646538 提供付款信息为您处理。

源码素材属于虚拟商品,具有可复制性,可传播性,一旦授予,不接受任何形式的退款、换货要求。请您在购买获取之前确认好 是您所需要的资源。