您现在的位置: 精品资料网 >> 管理信息化 >> 大数据 >> 资料信息

云计算分布式大数据Hadoop深入浅出案例驱动实战(PPT 214页)

所属分类:
大数据
文件大小:
11147 KB
下载地址:
相关资料:
云计算,分布式,大数据,深入浅出
云计算分布式大数据Hadoop深入浅出案例驱动实战(PPT 214页)内容简介
主要内容
学习Hadoop的目的
大数据时代来临
大数据
你准备好了吗?
什么是云计算?
云计算历史
云计算
云计算特征
云计算分类
云计算核心技术
云计算产生的前提
广泛的网络接入
虚拟化技术的成熟
计算能力提升
大数据的出现
云计算产生原动力
云计算发展现状
云参考架构--AWS
云参考架构--Google
云部署
以分钟时间部署复杂企业应用
谁需要云计算
三种运行模式
安装和配置步骤
VirtualBox安装虚拟机
虚拟机Network Adapter
安装Linux操作系统
Linux Shell
SSH安装
SSH无密码登录
Java安装
禁用IPV6
Clone Master虚拟机
Clone Master配置网卡
HDFS重要配置项
修改配置文件
创建hadoop.tmp.dir目录
部署slave节点
格式化HDFS文件系统
启动Hadoop
Web查看HDFS信息
大数据 & 数据结构
大数据存储
大数据的4V
大数据的服务器
大数据分析
Hadoop的思想之源:Google
Google低成本之道
Google面临的难题
Google关键技术和思想
Google三大论文
Hadoop的源起——Lucene
Hadoop发展历史
Hadoop群雄逐鹿
目前Hadoop达到的高度
Hadoop定义
Hadoop子项目家族
Pig
HBase
Hive
Zookeeper
Sqoop
Avro
Chukwa
Cassandra
Hadoop特点
Hadoop与Google比较
子系统位置
国内应用情况
案例1:淘宝
双十一191亿背后的开源技术?
淘宝数据平台——产品架构
案例2:暴风影音
应用领域
HDFS定义
HDFS设计基础与目标
HDFS不适合场景
HDFS架构
HDFS架构
HDFS体系结构
Namenode
Datanode
读取数据流程
HDFS文件操作
HDFS基本操作
列出HDFS文件
上传文件到HDFS
将HDFS的文件复制到本地
删除HDFS下的文档
查看文件内容
查看HDFS基本统计信息
进入和退出安全模式
节点添加
启动某些特定后台进程
负载均衡
HDFS API
Java调用HDFS演示
MapReduce算法思想
MapReduce逻辑部署
MapReduce运行机制
MapReduce 应用程序组成
Mapper
Reducer
Shuffler
命令操作
WordCount的运算过程
文件被分成3个split
Map的过程
Reduce的过程
调度机制
任务执行优化
错误处理机制:硬件故障
错误处理机制:任务失败
Hadoop命令大全
Hadoop API大全
Hbase的特点
Hbase介绍
Bigtable思想
Hbase逻辑模型
Hbase行键
Hbase列族与列
Hbase时间戳
Hbase vs Oracle
传统数据库的行式存储
Hbase物理模型
HMaster
HRegion Server
行式存储的问题
Table & Region
Hbase安装部署
Hbase Shell
微博介绍
Hbase实现微博
接下来将要实现的功能
用户管理
用户关注
发送微博
运行效果演示
基于短信话单的应用
Hbase应用
Hive简介
Hive
Hive的组件与体系架构
架构
Hive Data Types
Hive安装
Hive Shell
Hive API开发演示
改变IT运维思维方式
云计算趋势
总结

..............................