更新时间:2025-02-07 16:50:27
封面
版权信息
内容提要
前言
第1章 Hadoop大数据开发环境
1.1 Hadoop概述
1.1.1 Hadoop简介
1.1.2 Hadoop的优势
1.2 在VirtualBox上安装虚拟机
1.2.1 Master节点的安装
1.2.2 复制虚拟机
1.3 Hadoop安装前的准备工作
1.3.1 Linux主机的配置
1.3.2 安装SSH、配置SSH免密码登录
1.3.3 安装Java环境
1.4 Hadoop的安装与配置
1.4.1 Hadoop的安装
1.4.2 Hadoop单机模式的配置
1.4.3 Hadoop伪分布式模式的配置
1.4.4 Hadoop分布式模式的配置
1.5 习题
第2章 HDFS大数据分布式存储
2.1 HDFS的基本特征
2.2 HDFS的存储架构及组件
2.2.1 HDFS的存储架构
2.2.2 数据块
2.2.3 DataNode
2.2.4 NameNode
2.2.5 SecondaryNameNode
2.2.6 心跳消息
2.2.7 客户端
2.3 HDFS的Shell操作
2.3.1 查看命令的使用方法
2.3.2 HDFS常用的Shell操作
2.3.3 HDFS的管理员命令
2.3.4 HDFS的Java API操作
2.3.5 HDFS的Web管理界面
2.4 案例实战:HDFS编程
2.4.1 安装Eclipse
2.4.2 在Eclipse中创建项目
2.4.3 为项目添加需要用到的JAR包
2.4.4 编写Java应用程序
2.4.5 编译与运行程序
2.4.6 应用程序的部署
2.5 习题
第3章 MapReduce分布式计算框架
3.1 MapReduce概述
3.1.1 并发、并行与分布式编程的概念
3.1.2 MapReduce并行编程模型
3.1.3 Map函数和Reduce函数
3.2 MapReduce工作原理
3.2.1 MapReduce体系架构
3.2.2 MapTask工作原理
3.2.3 ReduceTask工作原理
3.3 案例实战:MapReduce编程
3.3.1 WordCount执行流程示例
3.3.2 WordCount具体实现
3.3.3 使用Eclipse编译与运行词频统计程序
3.4 习题
第4章 HBase分布式数据库
4.1 HBase概述
4.1.1 HBase的技术特点
4.1.2 HBase与传统关系数据库的区别
4.1.3 HBase与Hadoop中其他组件的关系
4.2 HBase系统架构和数据访问流程
4.2.1 HBase系统架构
4.2.2 HBase数据访问流程
4.3 HBase数据表
4.3.1 HBase数据表的逻辑视图
4.3.2 HBase数据表的物理视图
4.3.3 HBase数据表面向列的存储
4.3.4 HBase数据表的查询方式
4.3.5 HBase表结构的设计
4.4 HBase安装
4.4.1 下载安装文件
4.4.2 配置环境变量
4.4.3 添加用户权限
4.4.4 查看HBase的版本信息
4.5 HBase配置
4.5.1 单机模式的配置
4.5.2 伪分布式模式的配置
4.6 HBase的Shell操作
4.6.1 基本操作
4.6.2 创建表
4.6.3 插入与更新表中的数据
4.6.4 查询表中的数据
4.6.5 删除表中的数据
4.6.6 表的启用/禁用
4.6.7 修改表结构
4.6.8 删除HBase表
4.7 HBase的Java API操作
4.7.1 HBase数据库管理API
4.7.2 HBase数据库表API
4.7.3 HBase数据库表的行/列API
4.8 案例实战:HBase编程
4.8.1 在Eclipse中创建项目
4.8.2 添加项目需要用到的JAR包
4.8.3 编写Java应用程序
4.8.4 编译与运行程序
4.9 习题