您现在的位置: 精品资料网 >> 企业管理 >> 决策管理 >> 资料信息

决策树算法在商标分类中的应用(doc 6页)

所属分类:
决策管理
文件大小:
245 KB
下载地址:
相关资料:
决策树算法,商标分类
决策树算法在商标分类中的应用(doc 6页)内容简介
决策树算法在商标分类中的应用内容提要:
决策树方法是挖掘分类规则的有效方法,通常包括两个部分:①树的生成,开始时所有的数据都在根节点,然后根据设定的标准选择测试属性,
用不同的测试属性递归进行数据分割。②树的修剪,就是除去一些可能是噪音或异常的数据。基于信息熵的ID3算法、C4.5算法都能有效地生成决策树,建决策树的关键在于建立分支时对记录字段不同取值的选择。选择不同的字段值使划分出来的记录子集不同影响决策树生长的快慢及决策树的结构,从而可寻找到规则信息的优劣。可见,决策树算法的技术难点就是选择一个好的分支取值。利用好的取值产生分支可加快决策树的生长,更重要是产生好结构的决策树,并可得到较好的规则信息。相反,若根据一个差的取值产生分支,不但减慢决策树的生长速度,而且使产生的决策树分支过细、结构差,从而难以发现有用的规则信息。随着训练样本集中样本个数的不断增多(即样本集规模不断扩大),训练样本集在主存中换进换出就耗费了大量的时间,严重影响了算法效率。因此使算法能有效处理大规模的训练样本集已成为决策树算法研究的一个重要问题,也是目前国内对决策树算法研究的热点。本文利用决策树C4.5算法来解决图像的分类问题。

..............................