您现在的位置: 精品资料网 >> 管理信息化 >> 大数据 >> 资料信息

大数据与分布式计算培训教材(PPT 65页)

所属分类:
大数据
文件大小:
4553 KB
下载地址:
相关资料:
大数据,分布式,培训教材
大数据与分布式计算培训教材(PPT 65页)内容简介
HDFS
常用RAID技术
HDFS系统架构
什么是HDFS?
HDFS设计目标
不适合HDFS的场景
设计目标
HDFS主要组件的功能
文件
分而治之(Divide and Conquer)
MapReduce
MapReduce:大规模数据处理
MapReduce特性
WordCount
Hive QL – Join
Hive QL – Join in Map Reduce
Spark
Spark生态系统
Spark任务处理流程
Spark SQL
Spark Streaming
GraphX
Tachyon
Spark架构
Spark的基本组件。
Spark运行逻辑
..............................
大数据与分布式计算培训教材(PPT 65页)