传统的海量数据分析方案(PPT 45页)
传统的海量数据分析方案(PPT 45页)内容简介
传统的海量数据分析方案
Apache Hadoop项目
Apache Hadoop
HDFS设计
HDFS体系结构
MapReduce-“分而治之”
聚集查询(SUM、AVG等)
MapReduce
MapReduce执行流程
MapReduce容错
MapReduce容忍节点异构
Yahoo Pig& FaceBook Hive
HIVE体系结构
数据模型
Hive中的数据共享
Hive优点
Hive缺点
Spark
Spark容错
海量日志分析示例
Spark支持的操作
Spark优点
Hive体系结构
Shark体系结构
Stinger/Tez
Tez
Stinger体系结构
Impala
Impala体系结构
Impala支持的数据格式
大数据引擎测试
测试环境
..............................
Apache Hadoop项目
Apache Hadoop
HDFS设计
HDFS体系结构
MapReduce-“分而治之”
聚集查询(SUM、AVG等)
MapReduce
MapReduce执行流程
MapReduce容错
MapReduce容忍节点异构
Yahoo Pig& FaceBook Hive
HIVE体系结构
数据模型
Hive中的数据共享
Hive优点
Hive缺点
Spark
Spark容错
海量日志分析示例
Spark支持的操作
Spark优点
Hive体系结构
Shark体系结构
Stinger/Tez
Tez
Stinger体系结构
Impala
Impala体系结构
Impala支持的数据格式
大数据引擎测试
测试环境
..............................
用户登陆
大数据热门资料
大数据相关下载