본문 바로가기

시장조사론

경영학, 경제학, 경영지도사 대비 시장조사론 핵심 요점 정리 36. 표본추출과정

반응형

36. 표본추출과정

 

1) 일반적 표본추출과정


[표본추출의 일반적인 과정]

 

2) 모집단의 설정

 

(1) 모집단 설정을 위해 먼저 목표시장이 결정되어야 함
모집단: 조사 담당자의 관심 대상이 되는 사람, 제품, 기업, 지역 등의 집합체(set)
- 현재 또는 향후 자사 제품을 구입할 수 있는 표적소비자 집단이 되는 경우가 많음
- 모집단을 정확히 규정하기 위해 소비자집단, 기업 담당자, 소매점에서 제품을 직접 판매하
는 판매원들과의 면접을 통해 잠재적 고객을 파악하고, 이를 근거로 하여 모집단을 정
의하여야 함
- 조사 대상의 인구통계적 특성, 거주지역 및 시간 개념을 이용하여 구체적으로 규정됨
■  예) (목적) ① 자사 제품을 구매할 수 있는 잠재적 소비자들(개인 또는 조직체), ② 서울특별
시 및 전국 5대 광역시 지역에 거주하는 자, ③ 최근 1개월간 탄산음료를 1회 이상 구입한
자 등
■  예) (대상) ① 조사당일 현재 만 15세 – 25세 미만의 남녀, ② 3,574개의 동/읍/면 단위의
행정구역, ③ 국내 편의점 등


3) 표본 프레임의 선정


(1) 표본프레임: 모집단내에 포함된 조사 대상들의 명단이 수록된 목록
■  예) ① 행정구역편람에 수록된 우리나라의 동/읍/면 목록, ② 기업 연감에 수록된 상장 기업
들의 목록 등


(2) 일반 가구를 대상으로 한 조사의 경우 소비자들의 전체 목록이 필요하나, 현실적
으로 확보하는 것이 용이하지 않음. 이에 따라 전화번호부를 표본 프레임으로 많
이 사용함
■  전화번호부 – 현재 국내의 가구 전화 보급률은 95% 이상으로 대표성이 인정됨
■  다만, 전화를 2대 이상 갖고 있는 가구, 전화번호가 수록되지 않은 가구, 전화가 없는 가구
의 특성을 반영하지 못하는 한계점이 존재함
■  예) 2016년 총선에서 전화번호부를 표본 프레임으로 한 전화여론조사가 수도권의 집전화가
없는 20~30대 젊은 층 1인 가구의 의견을 적절히 반영하지 못해 선거 예측이 잘못된 경우
가 대표적 예라 할 수 있음


(3) 표본 추출에 이용될 표본 프레임이 존재하지 않는 경우가 많음
■  00년 10월 1일부터 00년 10월 10일까지 특정 장소를 방문한 고객을 모집단으로 설정하는
경우 모집단 자체가 유동적이며 표본 프레임이 존재하지 않을 것
■  대인 면접이 중심적인 상업적 시장조사에서는 표본 프레임 작성의 어려움으로 인해 비확률
표본추출방법이 주로 이용됨


4) 표본추출방법의 결정


(1) 모집단 규정과 가능한 범위 내에서의 표본 프레임 선정(입수)이 이루어지면 표본
추출방법에 대한 결정이 요구됨


(2) 표본추출방법은 확률표본추출방법(probability sampling)과 비확률표본추출방법
(non-probability sampling)으로 구분될 수 있음

 

[표본 추출방법 종류]

 

5) 비확률표본추출방법(Non-Probability Sampling)


(1) 정의: 표본프레임이 없어 모집단 내의 대상들이 선택될 확률을 사전에 모르는 상
태에서 표본이 선정되는 방법
■  추출된 표본이 모집단을 대표할 수 있는지의 여부 확인이 어려움
■  조사 결과에 어느 정도의 오류가 발생할 것인지에 대한 정보를 정확히 제시해 주지 못하는
한계점이 있음
■  하지만 확률표본추출방법에 비해 바람직하지 않은 추출 방법은 아님

) 우리나라 전체 가구 중, 1,000가구를 표본확률추출 할 시,
우리나라 모든 가구에 대한 정보가 필요함
정보가 있다 하더라도 추출된 표본가구를 일일이 찾아가 협조를 구하고, 조사하는 것은
현실적으로 불가능함
따라서 할당표본추출법과 같은 비확률적표본추출방법이 더 적정할 수 있음
) IPTV에 대한 소비자 반응을 조사하는 경우
소비자들은 신제품에 대한 이해가 부족할 수 있음
마케팅을 위한 다양한 자료를 수집하는 것이 어려울 수 있음
따라서 통신관련 전문가 혹은 유사 제품 판매 경험을 보유하고 있는 유통점의 점주 등을
대상으로 하는 판단표본추출법 등과 같은 비확률적표본추출방법이 더 적정할 수 있음

 

(2) 비확률표본추출방법의 유형
■  편의추출법(Convenience Sampling): 임의로 선정한 지역과 시간대에 조사자가 원하는 사람
들을 표본으로 선택하는 방법
- 표본추출비용이 거의 들지 않고 절차가 간단한 장점이 있음
- 추출된 표본이 모집단을 대표하지 못하고, 응답에 협조하는 대상만을 조사하게 됨으로써
응답을 거부하는 사람들의 특성이 반영되지 못한다는 문제점이 있음
- 예) ① TV 뉴스에서 오후 7시에 서울 명동을 지나가는 행인을 대상으로 유통시장개방에
대한 의견을 물어보는 경우, ② 한국 대학생의 라이프스타일을 조사하기 위해 특정 대
학 앞에서 지나가는 대학생 중 협조해 주는 대학생을 대상으로 한 조사 등


■  판단표본추출법(Purposive Sampling): 조사 문제를 잘 알고 있거나 모집단의 의견을 반영할
수 있을 것으로 판단되는 특정 집단을 표본으로 선택하는 방법
- 모집단의 특성을 대표하지 못한다는 문제점은 있으나 적은 비용으로 의미 있는 자료를 수
집할 수 있다는 장점을 가지고 있어 FGI와 같이 본조사 실시 전의 사전 조사에서 널리
활용되어 지고 있음
- 판단표본추출법은 전문적 지식을 보유한 대상을 찾아내는 것이 중요한데 필요한 표본을
충분히 확보하지 못했다면 먼저 접촉한 대상자를 대상으로 유사한 지식을 보유한 다른
대상자를 소개해 달라고 부탁함으로써 필요한 만큼의 응답 대상자를 확보할 수 있어 스
노우볼 추출법(snowball sampling) 이라고도 함
- 예) 기가인터넷에 대한 제품 개념을 명확히 이해하지 못하는 일반 소비자 대신 통신서비
스 관련 전문가 혹은 유사한 통신관련 서비스를 취급한 경험이 있는 판매원들 대상 조
사 실시


■  할당표본추출방법(Quota Sampling): 미리 정해진 분류기준에 의해 전체표본을 여러 집단으
로 구분하고 각 집단별로 필요한 대상을 추출하는 방법으로 상업적 조사에서 가장 널리 활
용되는 방법
- 추출된 표본이 인구통계적 특성에서 편중되지 않고 모집단의 특성이 적절히 반영될 수 있
도록 특성에 비례하여 추출함
- 사전에 모집단의 특성(분포)를 어느 정도 파악한 상태에서 이 정보를 표본할당 기준으로
활용하며 성별, 연령, 지역이 할당 기준으로 많이 활용되어 짐
- 예) 자사제품 구매고객의 30%가 30대 연령층이라면 전체 표본 중 30%를 30대의 연령층
에 할당하는 형태로 조사함

 

[할당표본추출법이 활용되는 이유]

 

■  비확률표본추출법이지만 조사자가 집단 분류 기준을 잘 선정하면 모집단의 특성을 충분히
반영할 수 있음
- 모집단 내의 상이한 특성을 가진 대상들을 표본집단에 포함시킴으로써 어느 정도의 대표
성을 확보할 수 있음
- 따라서 조사 담당자는 모집단에 대한 특성을 사전에 충분히 파악하여 적절한 할당기준을
선정하는 것이 필요함
- 그럼에도 불구하고 최종응답자들이 조사자의 편의대로 추출되므로 이 과정에 대한 적절
한 통제가 요구됨
■  할당표본추출법에 의해 추출된 각 집단의 표본 크기가 충분히 큰 경우(30개 이상) 각 집단별
측정자료는 정규분포의 형태를 가지게 되므로
(즉 모집단의 평균과 표본의 평균이 일치함)
모집단의 특성을 제대로 반영할 수 있음
■  확률표본추출방법과 같이 조사 결과의 오류 정도도 산출할 수 있음

 

[(예시) 할당표본추출법을 통한 전국 주요 대도시의 1,000명 표본 추출]

6) 확률표본추출방법(Probability Sampling)


(1) 정의: 조사 대상의 명단이 수록된 표본프레임이 있어 특정 조사 대상이 뽑힐 확률
에 대한 사전계산이 가능하며, 이에 따라 표본추출과정에서 발생되는 오류의 정도
에 대한 추정이 가능한 추출 방법
■  추출된 표본이 모집단을 잘 대표하는지에 대한 정확한 파악이 가능함
■  예) ‘본 표본조사의 결과는 모집단 내의 대상들을 모두 조사했을 경우와 비교해서 약 ±2%
이내의 차이가 발생할 확률이 95% 정도입니다’
■  표본프레임의 사전 확보가 전제되어지나 표적시장의 규모가 방대한 일반소비자 대상의 시장
조사는 현실적으로 거의 불가능함

■  다만 2,500개의 슈퍼체인협회에 등록된 슈퍼마켓 중 100개를 표본으로 추출하는 경우, 인천
지역에 소재한 100명 이상의 약 500개 업체에서 50개 기업을 선정하는 경우와 같이 모집단
의 수가 비교적 적은 경우에는 효과적으로 활용될 수 있음


(2) 확률표본추출방법의 유형
■  단순무작위 표본추출방법(Random Sampling): 단순무작위 표본추출법은 표본프레임내의 각
표본들에 대해 일련번호를 부여하고, 이를 이용해 일정수의 표본을 무작위(random)로 추출
하는 방법으로 확률표본추출방법 중 가장 기본적인 방법


[단순무작위 표본추출법에서의 표본추출과정]

모집단을 대표할 수 있는 표본프레임을 확보한다.
표본프레임내의 모든 표본들에 대하여 일련번호를 부여한다.
난수표(random number table)를 이용하여 표본수만큼의 난수*(random number)를 추출하고,
추출된 번호에 해당되는 표본이 선정된다.
*
난수란 규칙성이 없는 연속되는 수들이며, 이런 수를 모아놓은 것이 난수표이다.
위의 과정을 반복하여 조사대상표본수만큼의 표본단위를 추출한다.

 

- 단순무작위추출법은 가장 적용하기 쉬운 방법이나 실제로는 잘 사용되지 않음. 이는 ①
표본프레임 입수가 어렵고, ② 입수를 했더라도 각 표본에 번호를 붙이고 다시 난수를
이용한 추출을 통해 선정된 표본을 일일이 찾는 과정이 매우 번거롭고, ③ 전체 모집단
을 제대로 반영하지 못하는 경우가 있음(예. 무작위 추출 시, 특정 세부 그룹이나 집단
에서 추출될 수 있기 때문임)


■  층화표본추출법(stratified sampling): 모집단을 어떤 기준에 따라 서로 상이한 소집단
(strata)들로 나누고 이들 각 소집단들로부터 표본을 무작위로 추출하는 방법
- 장점: 집단간의 이질성(heterogeneity)이 존재하는 경우(즉 모집단이 다양한 특성을 가진
집단으로 구성되어 있는 경우) 무작위표본추출법보다 추출된 표본이 모집단의 특성을
더 잘 대표함
- 유의점: 집단구분을 위한 변수의 선정에 주의를 기울여야 함
- 예) 산업재 시장 조사의 경우 기업을 종업원 수, 자본금규모 등을 토대로 몇 개의 집단으
로 나눈 후 각 집단별로 표본을 할당하여 조사함


[층화추출법을 위한 표본프레임 분석 예시]

- 소집단 내에서 추출되는 표본의 수가 소집단의 크기에 비례하는 비례층화추출법과 그렇지
않은 불비례층화추출법으로 세분화할 수 있음. 이때 대/중견기업의 매출액이나 고용 규

모 등이 보다 많은 매출을 올리고 있어, 해당 산업의 매출액을 추정하기 위해서는 대/
중견기업의 비중을 보다 높이는 것이 정확도를 높일 수 있음


[층화추출법의 적용 예시]

- 비확률표본추출법의 할당표본추출법과 유사하나 할당표본추출법이 편의표본추출과 같이
비확률적인 방법에 의해 이루어지는데 반해 층화표본추출법은 각 소집단 내에서의 표본
추출이 무작위적으로 이루어진다는 점에서 차이가 있음
■  군집표본추출법(cluster sampling): 모집단을 소집단(또는 군집(cluster))들로 나누고 일정
수의 소집단을 무작위적으로 표본 추출한 다음, 추출된 소집단 내의 구성원들을 모두 조사하
는 방법
■  예) 대학생의 라이프스타일을 조사하는 경우 전국에서 몇 개의 대학을 선정하고, 대학 별로
학과와 학년을 선정하여 그에 해당하는 학생을 모두 조사하는 경우
- 장점: 조사에 소요되는 시간이나 경비를 줄일 수 있음
- 단점: 선출된 집단 내 표본들이 인구통계적 특성에서 동질적이면 모집단을 충분히 대표하
지 못함(예. 행정구역을 이용하여 특정 도시에서 10개 정도의 동과 통을 뽑고, 각 통
안에 거주하는 가구를 조사할 경우, 동일한 아파트 단지에 거주하는 가구일 경우 동일
성이 높을 수 있음)
- 지역표본추출법: 집단분류의 기준으로 지리적 구역이나 행정구역을 이용하여 모집단을 분
류하고 이들로부터 무작위적으로 선출된 일정수의 지역들을 대상으로 각 지역 내 모든
구성원들을 조사하는 방법
- 체계적 표본추출법 :전체표본에 대해 일정한 간격을 두고 표본 단위를 선정하는 방법
- 예) 백화점을 방문하는 고객의 조사를 위해 백화점 정문을 통해 입장하는 고객들 중 10번
째마다 조사하는 경우. 즉 전체 표본을 10개의 군집으로 나누고, 이들 중 한 군집을 선
택하여 그 군집 내의 대상을 모두 조사하는 방법과 동일함
- 다만 군집 구성원들이 규칙성을 보일 수 있어 이에 대한 고려가 필요함(예. 주부의 쇼핑
형태를 보면 대개 1주일을 기준으로 주말에 많은 쇼핑을 하고, 주중에 보조적인 쇼핑을
하는 경향을 보임. 따라서 특정 요일에 대한 선정이 아니라 5일이나 6일에 한 번씩 조
사하는 형태를 통해 규칙성으로 인한 오류를 극복할 수 있음)


7) 표본크기의 결정


(1) 연구목적 및 조사의 유형

■  표본의 크기는 연구 목적이나 조사의 유형에 따라 달라짐
■  예) 신제품의 반응을 보기 위한 조사의 경우
- 소비자면접을 실시하는 경우 집단 별로 6~12명 정도가 적정
- HUT, CLT 조사는 지역 제약과 1회 수용 가능 인원을 고려하면 일반적으로 100~200명
정도를 표본으로 하여 대도시 중심으로 실시하게 됨
- 전국의 대도시를 중심으로 한 서베이의 경우 500~1,000명 정도를 표본으로 이용


(2) 조사예산
■  일반소비자 대상 서베이나 제품 조사의 경우 표본 당 35,000~50,000원 정도의 조사비
■  소비자 면접에서는 면접 당 3백만원~4백만원 정도의 비용이 소요되는 것으로 보고됨
■  예) 전체 조사 예산이 3,000만원이고 2번의 사전 소비자면접과 1번의 서베이가 필요할 시
- 소비자 면접에 약 700만원 배정(350만원×2회), 2,300만원으로 서베이를 실시한다면 표본
수는 500~600명 정도로 산출됨(2,300만원 ÷ 40,000원)


(3) 시간의 제약
■  제품테스트를 위한 조사는 짧은 기간 내에 실시되어야 함에 따라 표본의 수가 적음
■  예) 신제품에 대한 소비자반응을 위한 CLT 조사를 위해 3개의 시제품이 준비됨
- 하루에 각 제품 별로 6명의 응답자를 조사할 수 있다면 1일 당 조사가능 응답자는 20명
내외로 산출됨
- 주어진 조사 기간이 10일 정도라면 조사 가능한 표본의 수는 최대 200명 정도로 산출됨


(4) 신뢰구간을 이용한 표본의 결정
■  조사자가 예상하는 자료의 신뢰구간 또는 오차의 범위도 표본 크기에 영향을 미침
■  예) 국회의원 후보자에 대한 여론조사를 통해 갑 후보의 지지율은 37%, 을 후보는 32%로
나왔다고 할 때, 실제 선거에서 갑 후보가 이길 수 있는가?
- 오차의 한계가 ±1%라면 갑 후보는 36~38%, 을 후보는 31~33%로 나타나, 갑 후보의
당선이 확실시 됨
- 반면 오차 한계가 ±3%라면 갑 후보는 34~40%, 을 후보는 29~35%로 나타나, 을 후보
가 당선될 수 있는 가능성을 배제할 수 없게 됨
- 따라서 이러한 오차의 한계 등이 고려되는 조사가 필요함

 

8) 조사대상의 선정


(1) 주어진 할당표에 따라 조사대상자를 선정하고, 조건 만족 여부의 확인이 필요함

 

반응형