您现在的位置: 精品资料网 >> 财务管理 >> 财务知识 >> 资料信息

量化研究与统计分析—集群分析(ppt 53页)

所属分类:
财务知识
文件大小:
1911 KB
下载地址:
相关资料:
量化研究,统计分析,集群分析
量化研究与统计分析—集群分析(ppt 53页)内容简介
内容简介:
将性质相近的现象归为一类,以便在大量复杂的特征归类后,找出其所存在的规律性,如经济现象
是定量研究分类问题的一种多元统计方法
找出同一类中的个体有较大的相似性之间相似度的统计量,以此为依据,采用某种集群方法(cluster method),将所有样本(或变量)分别集群到不同的类中
High internal (within-cluster) homogeneity
High external (between-cluster) heterogeneity
类内同质  类间异质
研究变量间亲疏程度的指针有两个距离
指两个事物距离多远的测量,通常将每一个样本看成m维(变量的个数)空间中的一个点,在这m维空间定义点与点之间距离,距离较近的点归为同一类,距离较远的点归入不同的类。
相似系数
指两个事物距离多近的测量,性质越近的样本,它们之间的相似系数越接近于1(或-1),而彼此无关的样本,它们之间的相似系数越接近于零。在进行集群处理时,将比较相似的样本归为一类,不怎么相似的样本归为不同的类。
距离与相似系数计算公式的选择,与资料特征、测量尺度和集群方法有关。
Hierarchical Cluster Analysis
也叫系统集群分析,是集群分析中应用最广泛的一种方法。
集群过程:把参与集群的样本(或变量)各视为一类,然后根据两类之间的距离或相似度逐步合并,直到所有样本(或变量)合并为一个大类为止。

..............................