您现在的位置: 精品资料网 >> 企业管理 >> 决策管理 >> 资料信息

决策树和决策规则培训教材(PPT 36页)

所属分类:
决策管理
文件大小:
498 KB
下载地址:
相关资料:
决策树,决策规则,规则培训,培训教材
决策树和决策规则培训教材(PPT 36页)内容简介
本章目标
分析解决分类问题的基于逻辑的方法的特性.
描述决策树和决策规则在最终分类模型中的表述之间的区别.
介绍C4.5算法.
了解采用修剪方法降低决策树和决策规则的复杂度.
第七章 决策树和决策规则
决策树和决策规则是解决实际应用中分类问题的数据挖掘方法。
一般来说,分类是把数据项映射到其中一个事先定义的类中的这样一个学习函数的过程。
由一组输入的属性值向量(也叫属性向量)和相应的类,用基于归纳学习算法得出分类。
学习的目标是构建一个分类模型,通常也叫分类器。
它可以根据有效的属性输入值预测一些实体(所给样本)的类。
是一个在样本其他属性已知的情况下预测另外一个属性(样本的类)的模型(分类的结果)。
7.1 决策树
从数据中生成分类器的一个特别有效的方法是生成一个决策树。
它是一种基于逻辑的方法,通过一组输入-输出样本构建决策树的有指导学习方法。
决策树包含属性已被检验的节点,一个节点的输出分枝和该节点的所有可能的检验结果相对应。
图7-2是一个简单的决策树。该问题有两个属性X,Y。所有属性值X>1和Y>B的样本属于类2。
不论属性Y的值是多少,值X <1的样本都属于类1。
对于树中的非叶节点,可以沿着分枝继续分区样本,每一个节点得到它相应的样本子集。
生成决策树的一个著名的算法是Quinlan的ID3算法,C4.5是它改进版。
ID3算法的基本思路:
..............................
决策树和决策规则培训教材(PPT 36页)