您現在的位置: 18luck新利全站下载 >> 18新利网址多少 >> 財務知識>> 資料信息

量化研究與統計分析—集群分析(ppt 53頁)

所屬分類:
財務知識
文件大小:
1911 KB
下載地址:
相關資料:
量化研究, 統計分析, 集群分析
量化研究與統計分析—集群分析(ppt 53頁)內容簡介
內容簡介:
將性質相近的現象歸為一類,以便在大量複雜的特征歸類後,找出其所存在的規律性,如經濟現象
是定量研究分類問題的一種多元統計方法
找出同一類中的個體有較大的相似性之間相似度的統計量,以此為依據,采用某種集群方法(cluster method),將所有樣本(或變量)分別集群到不同的類中
High internal (within-cluster) homogeneity
High external (between-cluster) heterogeneity
類內同質 類間異質
研究變量間親疏程度的指針有兩個距離
指兩個事物距離多遠的測量,通常將每一個樣本看成m維(變量的個數)空間中的一個點,在這m維空間定義點與點之間距離,距離較近的點歸為同一類,距離較遠的點歸入不同的類。
相似係數
指兩個事物距離多近的測量,性質越近的樣本,它們之間的相似係數越接近於1(或-1),而彼此無關的樣本,它們之間的相似係數越接近於零。在進行集群處理時,將比較相似的樣本歸為一類,不怎麼相似的樣本歸為不同的類。
距離與相似係數計算公式的選擇,與資料特征、測量尺度和集群方法有關。
Hierarchical Cluster Analysis
也叫係統集群分析,是集群分析中應用最廣泛的一種方法。
集群過程:把參與集群的樣本(或變量)各視為一類,然後根據兩類之間的距離或相似度逐步合並,直到所有樣本(或變量)合並為一個大類為止。

..............................

Baidu
map