機器學習之聚類算法——SLC算法


SL是single linkage的縮寫。SLC算法屬於層次聚類的一種。

假設有N個實例,需要得到K個類。




算法

- 初始化:每個實例自成一類

- 計算類間距離:類間距離定義為兩類中最近的兩點之間的距離

- 合並最近的兩個類

- 重復計算及合並N-K次,得到K個類




優點

SLC算法是確定性的,每次得到的結果都是一樣的;

如果把實例看做空間中的點,距離為點之間的邊長,那麼SLC算法其實就是最小生成樹算法;

可以把SLC算法的融合過程表示成一個樹,這個樹非常漂亮,因為有幾個根就有幾個類;而且可以隨意更改根數。


缺點

0 個評論

要回覆文章請先登錄註冊