您现在的位置: 精品资料网 >> 管理信息化 >> 大数据 >> 资料信息

大数据与分布式计算介绍(PPT 65页)

所属分类:
大数据
文件大小:
1339 KB
下载地址:
相关资料:
大数据,分布式
大数据与分布式计算介绍(PPT 65页)内容简介
大数据与分布式计算
HDFS
常用RAID技术
HDFS系统架构
什么是HDFS?
HDFS设计目标
不适合HDFS的场景
设计目标
HDFS主要组件的功能
文件
分而治之(DivideandConquer)
MapReduce
MapReduce:大规模数据处理
MapReduce特性
WordCount
Hive
HiveQL–Join
HiveQL–JoininMapReduce
了解Hive的意义
Hive架构
Hive执行流程
Hive操作符
Hive编译器
Spark
Spark生态系统
Spark任务处理流程
SparkSQL
SparkStreaming
GraphX
Tachyon
Spark架构
Spark的基本组件。
Spark运行逻辑
..............................
大数据与分布式计算介绍(PPT 65页)