python獲取最佳聚類數目?首先讓我們了解一下理論知識:聚類分析常常用于發現局部強相關的對象組,而異常檢測是發現局部不與其他對象強相關的對象,因此,聚類分析經常用于離群點檢測,而常用的檢測方法主要有:,我來為大家科普一下關于python獲取最佳聚類數目?下面希望有你要的答案,我們一起來看看吧!
首先讓我們了解一下理論知識:
聚類分析常常用于發現局部強相關的對象組,而異常檢測是發現局部不與其他對象強相關的對象,因此,聚類分析經常用于離群點檢測,而常用的檢測方法主要有:
丢棄遠離其他簇的小簇:
這個方法可以和其他聚類方法一起使用,但是需要最小簇大小和小簇與其他簇之間距離的阈值。而且這種方案對簇個數的選擇高度敏感,使用這個方案很難将離群點得分附加到對象上。也就是說丢棄小于某個最小阈值的所有簇。
基于原型的聚類:
首先聚類所有對象,然後評估對象屬于簇的程度(離群點得分)。在這種方法中,可以用對象到它簇中心的距離來度量屬于簇的程度。特别地,如果删除一個對象導緻該目标的顯著改進,則可将該對象視為離群點。對于基于原型的聚類,主要有兩種方法評估對象屬于簇的程度:一是度量對象到簇原型的距離,并用它作為該對象的離群點得分;二是考慮到簇具有不同的密度,可以度量簇到原型的相對距離,相對距離是點到質心的距離與簇中所有點到質心的距離的中位數之比。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!