2019.11.25. 오늘은 K-means Clustering을 간단히 설명하겠습니다. 말 그대로 K-means Clustering 이기 때문에, k개의 군집 중심을 가지면서 clustering을 하는 알고리즘입니다. 따라서 사용자가 사전에 몇 개의 클러스터를 가질지 정의해주게 됩니다. 그래서 k가 하나의 파라미터가 됩니다. k의 초기위치나 초기값은 랜덤하게 정해집니다.(이것또한 사용자가 사전정의를 어떻게 하느냐에 따라 달라집니다.) 데이터 차원에 따라서 데이터 샘플들이 분포하고 있을 때, 모든 데이터 샘플은 초기화된 k중 어느 위치에 가장 가까운지 판별하고 가장 가까운 위치를 자신의 군집으로 소속시킵니다. 모든 샘플에 대해 자기 자신의 군집을 조사하고 나면, 각 k군집중심 별로 데이터 샘플들이 모여있을..