57. 군집 분석 적용과정
1) 1단계: 조사대상 간 유사성(similarity) 정도 측정을 위한 변수 선정
(1) 조사대상에 대한 심층면접 또는 사전조사를 통하여 조사대상의 분류에 유의한 것
으로 보이는 변수 도출 및 선정
■ 예) 맥주 제조 회사인 O社는 소비자에 대한 사전조사를 통해 맥주 선호도를 결정하는 데 있
어 맥주맛의 신선도와 부드러움 정도가 중요한 속성임을 발견함
- O社 마케터는 맥주시장에서의 브랜드 간 경쟁정도를 파악하기 위해 O社, C社, H社, B社
등 잠재적 경쟁사로 인지하고 있는 회사의 대표적 제품을 대상으로 2가지 제품 속성에
대한 7점 척도를 활용하여 평가함
(2) 도출된 변수를 활용하여 각 측정대상 간 유사성 측정
2) 2단계: 조사대상에 대한 평가자료를 토대로 조사대상 간 유사성
지표(측정치)인 거리를 계산
(1) 조사대상 간 거리가 가까울수록 보다 유사한 것으로 해석
(2) 대표적인 방법으로 유클리디안 거리(Euclidean distance)가 있음
■ 각 변수를 축으로 하는 좌표상에 각 조사대상의 위치를 표시하고 피타고라스의 정리에 의해
거리를 계산하는 방법
■ 예) 한 응답자가의 데이터를 토대로 O社 브랜드에 대한 신선도를 5, 부드러움을 6으로 평가
하고, H社의 브랜드에 대한 신선도를 5, 부드러움 정도를 7로 평가 시, 다음과 같이 산출됨
- 이러한 방식으로 산출하면 다음과 같이 상대적 위치가 산출됨
3) 3단계: 거리행렬에 나타난 지표를 이용하여 유사한 조사대상들을
묶어주는 과정
(1) 거리가 가까운 곳부터 차례대로 묶어나가게 됨
■ 앞서 예에서 가장 가까운 C社와 H社, B社 브랜드의 순서대로 묶어나가게 됨
■ 즉 C-H, C-H-B, C-H-B-O의 순서대로 묶게 됨
(2) 거리 산정방법
■ 단일결합방식
■ 완전결합방식
■ 대상을 묶어나가는 과정에서 기존 집단과 새로운 집단(묶여진 집단) 간 거리 계산은 평균결
합방식이 널리 이용되고 있음
(3) 모든 조사대상을 하나씩 묶어가는 과정을 하나의 도표로 표현할 수 있으며 이를
덴드로그램(dendrogram)이라 함
4) 4단계: 군집들간의 특성차이를 가장 유의하게 보여주는 군집의 수를
택하고 각 군집별로 적절한 이름을 붙여 줌
(1) C社와 H社 브랜드의 특성을 고려하여 새로운 집단으로 명칭하고, 필요 시 B社
브랜드도 하나의 대상으로 묶거나 혹은 다른 집단으로 분류하여 자사의 브랜드와
비교 분석을 위한 대상으로 설정하게 됨
5) SPSS를 통한 군집분석 수행절차
(1) 1단계: [분석] → [분류 분석] → [계층적 군집분석]
(2) 2단계: 군집구분의 기준이 되는 변수들을 [변수] 박스에 넣음
(3) 3단계: 군집분석을 위한 대상 설정 및 옵션 설정
■ [방법]: 집단간거리를 이용한 군집방법과 제곱유클리디안거리를 대상으로 대상 간 거리 계산
의 기준으로 선택함
■ [도표]: ‘덴드로그램’에 표시하고, [출력 방향]은 ‘수평’에 표시함
■ [저장]: 기존 응답결과를 토대로 새로운 군집에 대한 값을 변수로 저장할 수 있음
(4) 결과 해석
■ 군집화 일정표를 통해 단계별로 어떤 응답결과가 묶여지는가를 알 수 있음
■ 1단계에서는 사례 60과 사례 61이 묶임
- 계수는 두 사례간의 거리가 얼마나 떨어져 있는지를 나타냄
- 계수 값이 적을수록 두 사례는 유사성이 높음
■ 계수 다음 군집1에 해당되는 0은 군집1이 0단계에 나왔다는 것을 의미함(=군집이 단일 사
례로 구성되었음을 의미함)
■ 다음 단계의 40은 1단계에서 60과 61이 조합된 군집이 40단계에서 다른 군집(또는 사례)과
다시 묶인다는 것을 말해줌
■ 덴드로그램: 군집분석 과정을 그림으로 나타낸 것
6) 군집분석의 한계점
(1) 실행과정이 다소 임의적이어 분석결과의 신뢰성이 낮음
■ 대상 간 거리를 측정하기 위한 변수의 선정, 거리계산방법, 대상을 묶는 방법 등에 대해 객
관적 기준보다는 연구자의 주관적 판단에 의해서 진행되기 때문임
■ 즉 거리 계산에 있어 어떤 변수가 이용되며, 어떻게 측정되었는가에 따라 산출된 거리가 달
라질 수 있음
(2) 군집의 수를 결정 시, 연구자의 주관적 판단에 따라 그 결과가 달라질 수 있음
(3) 응답자의 수가 많아지는 경우 모든 응답자에 대한 거리를 계산하는 과정이 길어
지고, 덴드로그램을 이용한 분석결과를 제시하기 어려워짐
(4) 따라서 이러한 한계점을 극복하기 위해 대상을 하나씩 순처적으로 묶어주는 계층
적 군집분석보다는 비계층적 군집분석인 K-평균(K-means) 분석을 널리 이용하고 있음
7) K-평균분석
(1) 집단의 수 K를 미리 지정하고, 전체 대상자를 K개의 집단으로 구분하는 방법
(2) 최적 집단의 수를 모르는 경우, 2~5개 정도의 집단 수를 고려한 분석을 반복적으
로 수행하고, 집단 간 차이가 가장 명확하게 나타나는 분석 결과를 제시하는 집단
수를 최적안으로 결정하게 됨
(3) K-평균분석 적용 과정
■ 1단계: 계층적 군집화에 의해 얻어진 최초의 군집결과, 즉 k개의 군집 수와 k개의 중심점을
입력 자료로 사용함
■ 2단계: 각 대상들은 k개의 시작점을 중심으로 근접성에 근거하여 가장 가까운 시작점에 묶
임
■ 3단계: 한번 뭉쳐진 집단에 대해 각 집단의 평균이 구해지고 이 값을 중심으로 동일한 절차
를 거쳐 다시 군집화를 시행하여 k개의 군집이 도출될 때까지 계속함
■ 4단계: 이 과정에서 어떤 대상이 사전에 한 군집에 묶였더라도 새로운 군집 시작점에 더 가
까우면 이 대상은 새로운 군집으로 다시 할당되기 때문에 오류를 줄일 수 있음
(4) K평균분석은 하나의 대상을 집단에 할당할 때마다 대상 간의 거리를 반복적으로
계산하지 않아 분석대상(케이스)이 많아져도 처리시간이 오래 걸리지 않는다는 장
점을 가지고 있음
(5) 하지만 분석에 이용한 기준변수에 따라 결과가 달라질 수 있고, 집단의 수를 연구
자가 주관적으로 판단해야 된다는 제약점을 가지고 있음
(6) SPSS를 통한 K-평균분석
(7) K-평균분석 결과
■ 사전 설정된 군집의 수(K)를 통해 적절하다 판단되는 군집을 선택하여 활용함
'시장조사론' 카테고리의 다른 글
경영학, 경제학, 경영지도사 대비 시장조사론 핵심 요점 정리 59. 컨조인트 분석 적용과정 (1) | 2024.07.12 |
---|---|
경영학, 경제학, 경영지도사 대비 시장조사론 핵심 요점 정리 58. 컨조인트 분석 개념 (1) | 2024.07.11 |
경영학, 경제학, 경영지도사 대비 시장조사론 핵심 요점 정리 56. 군집 분석 개념 (0) | 2024.07.09 |
경영학, 경제학, 경영지도사 대비 시장조사론 핵심 요점 정리 55. 요인 분석 적용과정 (1) | 2024.07.08 |
경영학, 경제학, 경영지도사 대비 시장조사론 핵심 요점 정리 54. 요인 분석 개념 (0) | 2024.07.07 |