您现在的位置: 精品资料网 >> 管理信息化 >> 大数据 >> 资料信息

数据挖掘技术概述(PPT 145页)

所属分类:
大数据
文件大小:
3723 KB
下载地址:
相关资料:
数据挖掘技术
数据挖掘技术概述(PPT 145页)内容简介

主要内容
数据挖掘概览
数据预处理
分类(Classification)
聚类(Cluster)
关联规则(Association Rule)
回归(Regression)

 

 

数据挖掘概览
数据挖掘定义
模式有效性度量
为何需要数据挖掘?
数据挖掘的意义
数据挖掘应用
数据挖掘步骤
数据质量:为何需要数据预处理?
数据挖掘预处理的主要任务
数据清洗
缺失值(Incomplete/Missing Data)
如何补充缺失值
噪声数据
如何处理噪声数据
分箱(Binning)
数据平滑的分箱方法
聚类:Cluster Analysis
Regression
数据集成
数据变换(规范化)
数据变换
数据规约
数据立方体
属性子集选择
维度规约
数值规约
离散化
抽样
分类
分类应用
分类步骤
(1)模型的构建
(2)利用模型分类
分类方法评价
分类器性能评价方式
评估分类方法的准确性
分类方法
基于距离的分类方法
基于距离的分类方法的直观解释
距离计算方法
基于距离的分类方法的一般性描述
K近邻算法(KNN)
决策树(Decision Tree)
决策树
决策树的步骤
分裂属性选择
信息增益的计算
决策树算法
决策树分类规则提取
贝叶斯分类
朴素贝叶斯分类
朴素贝叶斯分类举例
聚类:Cluster
聚类图示
聚类与分类的区别
聚类分析
K-means
初始值敏感
K-mediods步骤
聚类方法性能评价
聚类评价
常用的相似性度量方法
相似性度量方法
DBSCAN
基于密度方法的聚类- DBSCAN
DBSCAN聚类过程
关联规则
关联规则:Association Rule
规则度量:支持度与可信度
经典的发现频繁项目集算法
Apriori算法例子
Rule-generate算法例子
算法问题
FP-tree算法的基本原理
序列模式概念
序列模式表示
序列模式挖掘
序列模式挖掘算法
预测:Prediction
分类vs.预测
回归方法(Regression)
大型数据库中描述统计计量
度量中心趋势
度量数据的离散度
盒图-示例
基本统计类描述的图像显示-直方图


..............................