Study/Concepts

Unsupervised Learning

Juheon Kwak 2024. 4. 28. 19:22

- Clustering

ex) k-Means, DBSCAN, Hierarchical Clustering

 

- k-Means

 + 무작의 k개의 중심점(centroid)을 뽑은 다음, 그 centroid를 기준으로 얼마나 군집을 이루는가를 보는 것

 + 모든 중심점에서 모든 데이터의 거리를 구하고, 가장 가까운 중심점으로 데이터들을 매핑한다

 + 동일한 군집이라고 나온 구간에서 각각의 중심점을 다시 만들어낸다 

 + 계속 iteration을 반복하며 최적의 중심점을 찾게 된다

 + k라는 군집개수를 정해줘야 함

 

- DBSCAN

 + epsilon(거리)과 최소 포인트 수 값(중심 포인트를 기준으로 몇 개의 포인트들을 가지고 있을지)을 설정

 + 모든 포인트들을 다 보는데, 이 때 1번 조건을 만족한다면 Core point로 설정

 + epsilon 안에 들어온 point 들에 대해서 다시 1번 조건을 만족한다면 또 다시 core point로 설정 및 같은 군집으로 판단

 + 미리 군집 개수를 정해줄 필요가 없음

 

- Hierarchical Cluster

 + 계층적 군집으로 Tree 구조를 띔

 

- Clustering Measure

 + Silhouette statistic

 + 같은 군집 내에서 얼마나 가까이 분포하고, 다른 군집과 얼마나 멀리 분포하는지를 수치화하여 나타냄

 

- Association Rule Mining

ex) If A, then B