본문 바로가기

시장조사론

경영학, 경제학, 경영지도사 대비 시장조사론 핵심 요점 정리 45. 분산분석

반응형

45. 분산분석

 

1) 이용상황


(1) 분산분석(ANOVA: Analysis of Variance): 명목척도로 측정된 독립변수와 등간

또는 비율척도로 측정된 종속변수 사이의 관계를 분석하는 기법
즉 독립변수에 의해 분류된 2개 이상의 집단 간의 평균값(종속변수 혹은 결과변수의 값)을
비교하는 데 사용되는 통계기법
♤  검증통계량은 F-값을 사용함

 

(2) 분산분석 적용 사례
♤  10대와 20대 세분 시장간에 선호하는 청바지의 가격 차이 여부

♤  서울 강남의 압구정동과 강북지역 주부들 간 한 달간 백화점 쇼핑횟수 차이 여부
♤  대리점, 직영점 등 서로 다른 유통형태에 따라 매출이나 이익의 차이 여부 등


(3) 분산분석의 유형
♤  일원분산분석(One-way ANOVA): 하나의 범주형 독립변수와 종속변수 간의 관계
♤  다원분산분석(n-way ANOVA): 2개 이상의 독립변수의 수준 변화가 종속변수에 미치는 효
과를 조사하는 데 사용
- 이원분산분석: 2개의 독립변수의 수준 변화가 종속변수에 미치는 효과 분석
♤  예시
- 일원분산분석: 소비자의 제품사용량에 따라 시리얼 브랜드 선호도 차이
- 이원분산분석: 제품사용량과 나이에 따라 시리얼 브랜드 선호도 차이

 

(4) 분산분석의 절차

 

2) 분산분석의 적용 과정


(1) 사례 설정

♤  O는 분말 형태의 세탁 세제를 판매하고 있는데, 최근 두 달간 매출감소를 만회하기 위해
다음 달부터 판촉 프로그램을 계획하고 있음
♤  이를 위해 현재 20% 가격 인하와 판촉물을 제공하는 방법 중 보다 효과적인 판촉 수단을
선택하기 위해 서울 시내
15개 슈퍼마켓을 표본으로 선정하여 판촉 유형이 매출액에 미치는
효과를 조사하기로 결정함

 

(2) 분석 환경 설정
♤  총 15개 점포에 대해 5개는 아무런 판촉을 실시하지 않고, 다른 5개에 대해서는 20% 가격
인하, 또 다른 5개에 대해서는 제품 가격의 약 20%에 상당하는 판촉물(플라스틱 용기 또는
자사의 샴푸 중 하나 선택)을 제공함
♤  이를 통해 다음과 같이 판촉 유형에 따른 점포 별 매출증가율 자료가 조사됨

(3) 가설 설정
♤  분산분석에서 귀무가설은 ‘각 집단의 종속변수 평균값이 동일하다’는 것
♤  즉, 독립변수(본 사례에서는 판촉형태)가 종속변수(매출)의 변화에 영향을 주지 못한다는 것
이 귀무가설이라 할 수 있음
♤  μ1, μ2, 그리고 μ3를 각각 판촉형태 별 집단의 매출 평균값이라 하고, 그 평균값의 차이가
있는 지의 검증을 위해 다음과 같이 가설 설정을 함

 

♤  이는 본 사례에 적용 시 다음과 같이 가설로 설정될 수 있음

 

(4) 분산분석 시, 필요로 하는 집단 특성에 대한 가정의 검토
♤  분산분석 적용 시, 다음의 전제조건을 충족시키고 있는지에 대한 검토가 필요함

 

♤  각 집단은 서로 독립적이어야 함. , 한 집단에 대해 시간 간격을 두고 세 번 종속변수의
값을 측정한 후 이들 간의 차이를 조사하는 경우는 각 집단이 동일하므로 분산분석의
적용이 어려움
♤  각 집단은 정규분포를 이루어야 함. 이를 충족시키기 위해 집단별로 표본의 수가 30명 이상
되는 것이 바람직하며
, 어느 한 집단의 표본 수가 적은 경우 해당 집단을 제거하든지 혹은
가장 유사한 집단과 합쳐 분석을 해야 함
.(. 학력별 백화점 이용실태 조사 시, 중졸 이하나
대학원 이상의 학력을 가진 응답자가 적은 경우 이들을 분석에서 제외하거나 고절 이하나
대졸 이상 집단에 포함시켜 분석을 하는 것이 권장됨
♤  집단 별 분산(variance)의 정도가 비슷해야 함. 분산의 정도가 비슷할 때, 평균의 비교가
의미 있으나 분산의 차이가 클 때
, 평균 비교가 의미가 없을 수 있음(A, B는 평균의 비교가
의미가 있으나
, A, C는 의미를 가지지 못할 수 있음)

 

(5) 검증통계량의 계산
♤  분산분석에서 가설검증을 위해 사용되는 통계량은 F통계량임
- 종속변수의 각 관찰값(본 사례에서는 집단 별 각 점포의 매출액)을 ‘전체 평균과 집단 평
균 간의 차이’와 ‘집단평균과 개별 관찰치와의 차이’로 구분하고, 이들 차이의 크기를
토대로 집단 간 차이가 유의한지를 검토하게 됨

 

총편차(전체평균 개별관찰값) = 집단 간 편차(전체평균 집단평균) + 집단 내 편차(집단평균
개별관찰값)

 

이를 세가지 변량의 형태로 재설계하면

 

총변량(SST, Sum of Squaress Total) = 집단 간 변량(SSB, Sum of Squaress Between
groups) +
집단 내 변량(SSW, Sum of Squaress Within groups)

 

♤  총변량(SST, Sum of Squares Total): 각 관찰값들이 전체 표본의 평균을 중심으로 얼마만
큼의 변량을 보이는가를 측정하는 것

 

 

♤  집단간 변량(SSB, Sum of Squares Between groups): 독립변수(판촉유형)에 의해 나누어
진 각 집단(판촉을 실시하지 않은 집단, 가격인하 집단, 판촉물 제공 집닫)의 평균이 전체 표
본의 평균을 중심으로 어느 정도의 변량을 보이는 지를 측정하게 됨

♤ 집단내 변량(SSW, Sum of Squares Within groups): 각 표본집단 내 개별 관찰치들이 각
표본집단의 평균을 중심으로 어느 정도의 변량을 보이는지를 측정함

♤  집단 간 변령과 집단 내 변량이 산출되면 이를 이용하여 집단 간 차이를 검증할 수 있음

- 분산분석에서 집단 간 차이가 유의하기 위해서는 ① 집단 내 변량은 가능한 적어야 하고,
② 집단 간 변량은 가능한 커야 함
- 즉 유의성 검증을 위해서는 집단 간 변량과 집단 내 변량의 상대적 비율을 활용하게 됨
- 이를 F통계량이라 함

 

♤  F통계량의 계산을 위한 과정은 분산분석표(ANOVA Table)로 요약될 수 있음

 

♤  판촉유형 별 세탁세제 매출효과에 대한 사례에 대한 분산분석표는 다음과 같이 작성됨

 

(6) 유의성 검증과 결과 해석
♤  조사자는 집단 간 차이에 대한 가설 검증을 위해 분산분석표를 이용하여 계산된 F통계량과
비교하기 위한 기준값인 임계치를 설정해야 함
♤  F통계량은 자유도 ‘집단 수 – 1’과 ‘표본 수 – 집단 수’의 F분포를 따르게 됨

 

 

 

♤  F-value는 20.46으로 임계치 3.89보다 훨씬 큰 것으로 나타남에 따라 집단 간 평균의 차이
가 없을 것이라는 귀무가설을 기각하게 됨
♤  즉 2가지 판촉 방법 모두가 의미가 있게 매출을 증가시키는 것으로 결론을 내릴 수 있음


3) 실험설계 유형에 따른 분산분석의 종류


(1) 사례 설정

♤  앞에서 설정된 사례 중 우리 회사뿐만 아니라 경쟁기업에서도 동시에 판촉을 진행하고 있는
경우가 있어 이에 대한 고려가 요구됨
♤  즉 경쟁업체의 판촉이 있는 경우와 없는 경우가 우리 회사 매출에 영향을 미치는 효과를
반영할 수 있어야 함

 

(2) 분석 환경 설정
♤  총 15개 점포에 대해 5개는 아무런 판촉을 실시하지 않고, 다른 5개에 대해서는 20% 가격
인하, 또 다른 5개에 대해서는 제품 가격의 약 20%에 상당하는 판촉물(플라스틱 용기 또는
자사의 샴푸 중 하나 선택)을 제공함
♤  이를 통해 다음과 같이 판촉 유형에 따른 점포 별 매출증가율 자료를 작성해야 함

 

 

(3) 분산분석 방법
♤  일원분산분석(One-way ANOVA) 방법과 동일하나, 개발관찰치의 총변량을 ‘집단 간 차이,
통제변수 간 차이, 그리고 집단 내 차이’로 분리하여 도출하는 점에서 차이가 있음
♤  즉 ‘통제변수간 차이’를 고려함으로써 통제변수의 효과를 반영한다는 점
독립변수와 통제변수의 수에 따른 분산분석 유형

 

 

4) 다원분산분석을 이용한 가설검증


(1) 사례 설정

 

♤  L의 치약제품 마케팅 책임자는 제품향(오렌지향, 장미향, 박하향)과 가격 수준(500,
600
, 650)이 매출에 미치는 효과를 조사하려고 함
♤  이를 위해 3가지 제품향과 3가지 가격의 조합에 의해 9개의 시제품을 개발한 후 유사한
소매점포를
9개 선정하여 각 점포별로 하나의 시제품만을 취급하도록 함

 

(2) 분석 환경 설정
♤  각 점포별 시제품의 판매량은 다음과 같이 조사됨

 

(3) 가설 설정
♤  독립변수에 대한 각각의 효과와 독립변수 간 상호작용효과에 대한 가설이 설정되어 검증이
수행됨
♤  독립변수 각각의 효과에 대한 가설

 

♤  독립변수 간 상호작용효과에 대한 가설*

 

- 본 예시에서는 상호작용효과가 없을 것으로 가정하고, 이에 대한 검증은 생략함


♤  [참조] 상호작용의 의미

 

(4) 검증통계량의 계산
♤  이원분산분석도 변량을 활용한 F통계량이 상요됨
♤  이를 위해 독립변수 X1과 X2가 각각 C1, C2개의 범주로 나누어진다고 가정하고, 이를 바탕
으로 총변량을 구하면 다음과 같음

 

♤  이를 토대로 산출된 분산분석표는 다음과 같음

 

(5) 유의성 검증 및 결과해석
♤  유의수준 0.05, 분자 자유도 2, 분모 자유도 4 F분포의 임계치는 6.94
♤  F통계량은 0, 2.7이므로 임계치보다 작음. 따라서 귀무가설이 유지됨(채택됨)
♤  따라서 제품 가격의 변화와 치약향의 유형이 시제품의 판매량에 영향을 미치지 않는다고 결
론 내릴 수 있음

반응형