您现在的位置: 精品资料网 >> 管理信息化 >> 大数据 >> 资料信息

传统的海量数据分析方案(PPT 45页)

所属分类:
大数据
文件大小:
3342 KB
下载地址:
相关资料:
数据分析,分析方案
传统的海量数据分析方案(PPT 45页)内容简介
传统的海量数据分析方案
Apache Hadoop项目
Apache Hadoop
HDFS设计
HDFS体系结构
MapReduce-“分而治之”
聚集查询(SUM、AVG等)
MapReduce
MapReduce执行流程
MapReduce容错
MapReduce容忍节点异构
Yahoo Pig& FaceBook Hive
HIVE体系结构
数据模型
Hive中的数据共享
Hive优点
Hive缺点
Spark
Spark容错
海量日志分析示例
Spark支持的操作
Spark优点
Hive体系结构
Shark体系结构
Stinger/Tez
Tez
Stinger体系结构
Impala
Impala体系结构
Impala支持的数据格式
大数据引擎测试
测试环境
..............................