클러스터링은 비지도 학습기법으로 유사한 유형의 데이터를 그룹화함으로써 숨겨진 구조를 파악합니다. 클러스터링을 활용하면 추천 엔진, 검색 엔진, 시장 세분화 등을 구현할 수 있습니다. K-means Clustering이란? "K"는 주어진 데이터를 그룹화할 수 즉, 클러스터 개수를 말합니다. "Means"는 각 클러스터의 중심과 데이터들의 평균 거리를 의미합니다. 이 때, 클러스터의 중심을 centroids라고 합니다. K-means 알고리즘은 다음과 같은 과정을 수행합니다. 1. 데이터셋에서 K개의 centroids를 임의로 지정. 2. 각 데이터들을 가장 가까운 centroids와 같은 그룹으로 할당. 3. 2번 과정에서 할당된 결과로 centroids를 다시 지정. 4. 2~3번 과정을 반복하면서 c..