数据挖掘决策树的建立(PPT 23页)
数据挖掘决策树的建立(PPT 23页)内容简介
学习数据挖掘的工具-weka
天气数据
ID3决策树算法描述
信息值(熵)、信息增益的概念
ID3算法的不足及改进
C4.5算法做出的改进
C4.5算法的缺点
weka是用Java语言编写的完整的软件资源
Explorer是weka的主要图形用户界面
weka存储数据的原始方式是ARFF或CSV文件格式
ARFF文件是由一组实例组成,
并且每组实例的属性值由逗号分开。(属性的类别)
决策节点:
1.最上面的节点称为根节点,是整个决策树的开始。
2.每个节点子节点的个数与决策树在用的算法有关。(二叉树、多叉树)
分支:判断过程,要么是新的决策节点,要么是叶子
树叶:树的结尾,每个叶子代表一个类别
..............................
天气数据
ID3决策树算法描述
信息值(熵)、信息增益的概念
ID3算法的不足及改进
C4.5算法做出的改进
C4.5算法的缺点
weka是用Java语言编写的完整的软件资源
Explorer是weka的主要图形用户界面
weka存储数据的原始方式是ARFF或CSV文件格式
ARFF文件是由一组实例组成,
并且每组实例的属性值由逗号分开。(属性的类别)
决策节点:
1.最上面的节点称为根节点,是整个决策树的开始。
2.每个节点子节点的个数与决策树在用的算法有关。(二叉树、多叉树)
分支:判断过程,要么是新的决策节点,要么是叶子
树叶:树的结尾,每个叶子代表一个类别
..............................
下一篇:尚无数据
用户登陆
决策管理热门资料
决策管理相关下载