- Clustering
ex) k-Means, DBSCAN, Hierarchical Clustering
- k-Means
+ 무작의 k개의 중심점(centroid)을 뽑은 다음, 그 centroid를 기준으로 얼마나 군집을 이루는가를 보는 것
+ 모든 중심점에서 모든 데이터의 거리를 구하고, 가장 가까운 중심점으로 데이터들을 매핑한다
+ 동일한 군집이라고 나온 구간에서 각각의 중심점을 다시 만들어낸다
+ 계속 iteration을 반복하며 최적의 중심점을 찾게 된다
+ k라는 군집개수를 정해줘야 함
- DBSCAN
+ epsilon(거리)과 최소 포인트 수 값(중심 포인트를 기준으로 몇 개의 포인트들을 가지고 있을지)을 설정
+ 모든 포인트들을 다 보는데, 이 때 1번 조건을 만족한다면 Core point로 설정
+ epsilon 안에 들어온 point 들에 대해서 다시 1번 조건을 만족한다면 또 다시 core point로 설정 및 같은 군집으로 판단
+ 미리 군집 개수를 정해줄 필요가 없음
- Hierarchical Cluster
+ 계층적 군집으로 Tree 구조를 띔
- Clustering Measure
+ Silhouette statistic
+ 같은 군집 내에서 얼마나 가까이 분포하고, 다른 군집과 얼마나 멀리 분포하는지를 수치화하여 나타냄
- Association Rule Mining
ex) If A, then B