大数据与分布式计算培训教材(PPT 65页)
大数据与分布式计算培训教材(PPT 65页)内容简介
HDFS
常用RAID技术
HDFS系统架构
什么是HDFS?
HDFS设计目标
不适合HDFS的场景
设计目标
HDFS主要组件的功能
文件
分而治之(Divide and Conquer)
MapReduce
MapReduce:大规模数据处理
MapReduce特性
WordCount
Hive QL – Join
Hive QL – Join in Map Reduce
Spark
Spark生态系统
Spark任务处理流程
Spark SQL
Spark Streaming
GraphX
Tachyon
Spark架构
Spark的基本组件。
Spark运行逻辑
..............................
常用RAID技术
HDFS系统架构
什么是HDFS?
HDFS设计目标
不适合HDFS的场景
设计目标
HDFS主要组件的功能
文件
分而治之(Divide and Conquer)
MapReduce
MapReduce:大规模数据处理
MapReduce特性
WordCount
Hive QL – Join
Hive QL – Join in Map Reduce
Spark
Spark生态系统
Spark任务处理流程
Spark SQL
Spark Streaming
GraphX
Tachyon
Spark架构
Spark的基本组件。
Spark运行逻辑
..............................
用户登陆
大数据热门资料
大数据相关下载