大数据与分布式计算介绍(PPT 65页)
大数据与分布式计算介绍(PPT 65页)内容简介
大数据与分布式计算
HDFS
常用RAID技术
HDFS系统架构
什么是HDFS?
HDFS设计目标
不适合HDFS的场景
设计目标
HDFS主要组件的功能
文件
分而治之(DivideandConquer)
MapReduce
MapReduce:大规模数据处理
MapReduce特性
WordCount
Hive
HiveQL–Join
HiveQL–JoininMapReduce
了解Hive的意义
Hive架构
Hive执行流程
Hive操作符
Hive编译器
Spark
Spark生态系统
Spark任务处理流程
SparkSQL
SparkStreaming
GraphX
Tachyon
Spark架构
Spark的基本组件。
Spark运行逻辑
..............................
HDFS
常用RAID技术
HDFS系统架构
什么是HDFS?
HDFS设计目标
不适合HDFS的场景
设计目标
HDFS主要组件的功能
文件
分而治之(DivideandConquer)
MapReduce
MapReduce:大规模数据处理
MapReduce特性
WordCount
Hive
HiveQL–Join
HiveQL–JoininMapReduce
了解Hive的意义
Hive架构
Hive执行流程
Hive操作符
Hive编译器
Spark
Spark生态系统
Spark任务处理流程
SparkSQL
SparkStreaming
GraphX
Tachyon
Spark架构
Spark的基本组件。
Spark运行逻辑
..............................
用户登陆
大数据热门资料
大数据相关下载