受众调查与分析6抽样设计与方法.pptx
《受众调查与分析6抽样设计与方法.pptx》由会员分享,可在线阅读,更多相关《受众调查与分析6抽样设计与方法.pptx(36页珍藏版)》请在冰点文库上搜索。
第六章抽样技术与方法第六章抽样技术与方法p抽样调查的一般原理抽样调查的一般原理p概率抽样概率抽样p非概率抽样非概率抽样p如何确定样本量如何确定样本量一天,爸爸叫儿子去买一盒火柴。
临出门一天,爸爸叫儿子去买一盒火柴。
临出门前,爸爸嘱咐儿子要买能划燃的火柴。
儿前,爸爸嘱咐儿子要买能划燃的火柴。
儿子拿着钱出门了,过了好一会儿,儿子才子拿着钱出门了,过了好一会儿,儿子才回到家。
回到家。
“火柴能划燃吗?
”爸爸问。
火柴能划燃吗?
”爸爸问。
“都能划燃。
”都能划燃。
”“你这么肯定?
”你这么肯定?
”儿子递过一盒划过的火柴,兴奋儿子递过一盒划过的火柴,兴奋地说:
“我每根都试过啦。
”地说:
“我每根都试过啦。
”要知道一锅汤的味要知道一锅汤的味道道,该怎么办呢该怎么办呢?
想知道一批导弹的杀伤半径,想知道一批导弹的杀伤半径,采用什么调查方法?
为什么?
采用什么调查方法?
为什么?
怎样估计鱼塘里怎样估计鱼塘里有多少条鱼有多少条鱼?
第一节抽样调查的一般原理第一节抽样调查的一般原理抽样调查是市场调查中最科学、最重要抽样调查是市场调查中最科学、最重要、最常用的方法。
、最常用的方法。
一、重要术语一、重要术语总体:
是能够提供所需信息的全部对象;总体:
是能够提供所需信息的全部对象;个体:
单个对象称为个体;个体:
单个对象称为个体;样本:
是总体的一部分,它由从总体中按样本:
是总体的一部分,它由从总体中按一定程序选取的部分个体或抽样单元组成;一定程序选取的部分个体或抽样单元组成;抽样框是指用以代表总体,并从中抽选抽样框是指用以代表总体,并从中抽选样本的一个框架。
其具体表现形式主要有包样本的一个框架。
其具体表现形式主要有包括在总体全部单位内的名册、地图等。
括在总体全部单位内的名册、地图等。
抽样单元为了便于抽样,通常将总体部抽样单元为了便于抽样,通常将总体部分划分为有限个互不重叠又穷尽的部分,每分划分为有限个互不重叠又穷尽的部分,每一个部分称为抽样单元。
一个部分称为抽样单元。
二、抽样调查的特点及适用条件二、抽样调查的特点及适用条件
(一)特点
(一)特点1.1.抽样调查的优点抽样调查的优点(11)降低成本)降低成本(22)节约时间)节约时间(33)减少误差)减少误差2.抽样调查的不足抽样调查的不足存在抽样误差存在抽样误差:
随机抽样(误随机抽样(误差可控制,更大的实用性)差可控制,更大的实用性)非随机抽样(误差不可控制)非随机抽样(误差不可控制)(二二)适用条件适用条件1.1.当调查对象总体数量过多,而不能或当调查对象总体数量过多,而不能或难以采用普查时;难以采用普查时;2.2.当调查不适宜或不必进行普查时;当调查不适宜或不必进行普查时;3.3.当调查用于采集时效性较强;当调查用于采集时效性较强;4.4.当调查用于核对和普查准确性时。
当调查用于核对和普查准确性时。
三、抽样调查的一般程序三、抽样调查的一般程序定定义义并并确确定定调调查查总总体体确确定定必必要要的的样样本本容容量量选选择择抽抽样样方方法法数数据据处处理理实实施施调调查查概率抽样概率抽样非概率抽样非概率抽样第二节概率抽样第二节概率抽样一、概率抽样的概念及特点一、概率抽样的概念及特点
(一)概念:
概率抽样又称随机抽样
(一)概念:
概率抽样又称随机抽样
(二)特点
(二)特点1.1.按随机原则进行抽样的;按随机原则进行抽样的;2.2.具有统计推算的原则。
具有统计推算的原则。
二、概率抽样方法二、概率抽样方法
(一)简单随机抽样又称纯随机抽样
(一)简单随机抽样又称纯随机抽样是是最基本的概率抽样方法。
就是对总体单位不最基本的概率抽样方法。
就是对总体单位不经任何分组、排队,排除任何有目的选择,经任何分组、排队,排除任何有目的选择,完全按随机原则抽取调查单位。
该抽样方法完全按随机原则抽取调查单位。
该抽样方法保证每一抽样单位都有相同的非零抽中概率。
保证每一抽样单位都有相同的非零抽中概率。
若总体为若总体为NN,样本量为,样本量为nn,则每一抽样,则每一抽样单位的抽中概率:
单位的抽中概率:
p=n/Np=n/N1.1.抽签法抽签法2.2.随机数字表法随机数字表法
(二)系统抽样:
又称间隔抽样、机械
(二)系统抽样:
又称间隔抽样、机械抽样:
例如:
抽户的方法是先确定一户,抽样:
例如:
抽户的方法是先确定一户,如第如第55户,以后每间隔户,以后每间隔1010户抽一户,则得户抽一户,则得到样本户到样本户55、1515、2525、3535(三)分层抽样:
先按某种特征将总体(三)分层抽样:
先按某种特征将总体分为若干组(类型、区),统称为“层”分为若干组(类型、区),统称为“层”,再从每一“层”中进行随机抽样。
,再从每一“层”中进行随机抽样。
p128p128(四)整群抽样:
以“整群”为抽样单(四)整群抽样:
以“整群”为抽样单位。
例如以乡、村等为“整群”进行抽位。
例如以乡、村等为“整群”进行抽样。
样。
(五)多阶段抽样:
例如在市(区、(五)多阶段抽样:
例如在市(区、县)中先以乡镇(街道)为整群进行抽样县)中先以乡镇(街道)为整群进行抽样再在乡(街道)中以管理区(村)、居委再在乡(街道)中以管理区(村)、居委会为整群进行抽样。
会为整群进行抽样。
p130p130抽样调查实例抽样调查实例编号乡镇编号乡镇人口数人口数累计累计编号乡镇编号乡镇人口数人口数累计累计编号乡镇编号乡镇人口数人口数累计累计1城关镇城关镇22000220007平原乡平原乡1640013490013新店镇新店镇100002055002平湖镇平湖镇21000430008新原乡新原乡15000149900*14安定乡安定乡95002150003玉阳镇玉阳镇2000063000*9古农乡古农乡1400016390015五岖乡五岖乡89002239004五一乡五一乡195008250010王店乡王店乡1100017490016五庙乡五庙乡85002324005新龙乡新龙乡18400100900*11双莲乡双莲乡10500185400*17双山乡双山乡82002406006湖泊乡湖泊乡1760011850012桐连乡桐连乡10100195500*18四顶乡四顶乡8000248600*抽样调查实例抽样调查实例1.1.全县人口累计(各乡)数为:
全县人口累计(各乡)数为:
2486002486002.2.抽样间隔:
抽样间隔:
248600/5=49720248600/5=497203.3.取一张人民币:
号为取一张人民币:
号为FP59243854FP59243854,后,后55位为位为4438543854,是为随机数,是为随机数4.4.确定第一个样本:
确定第一个样本:
4385443854落在第落在第33编号乡(玉阳编号乡(玉阳镇)后面的累计数之内,故确定玉阳为第镇)后面的累计数之内,故确定玉阳为第11个样个样本。
本。
5.5.确定第二个样本:
确定第二个样本:
43854+49720=9357443854+49720=93574,落,落在第在第55编号乡后面的累计数之内,故确定新龙乡编号乡后面的累计数之内,故确定新龙乡为第为第22个样本。
个样本。
6.6.确定第三个样本:
确定第三个样本:
93574+49720=14329493574+49720=143294,落,落在第在第88编号乡后面的累计数之内,故确定新原乡编号乡后面的累计数之内,故确定新原乡为第为第33个样本。
个样本。
随机整群抽样实例随机整群抽样实例编号编号村村人口数人口数累计数累计数编号编号村村人口数人口数累计数累计数1镇西店村镇西店村7247247长生庙村长生庙村58946062唐家铺村唐家铺村72114458王甸子村王甸子村57451803镇东村镇东村68921349民生村民生村57157514镇北村镇北村6712805*10清平村清平村5446295*5李家店村李家店村610341511老平埠村老平埠村53468296湖泊村湖泊村602401712高水村高水村5087337随机整群抽样实例随机整群抽样实例全乡人口(各村人口累计):
全乡人口(各村人口累计):
73377337抽样间隔:
抽样间隔:
7337/2=36697337/2=3669取一张人民币,确定其编号后四位数取一张人民币,确定其编号后四位数22227373为随机数为随机数确定第一个样本:
确定第一个样本:
22732273落在第四编号落在第四编号(镇北村)的累计数之内,确定镇北村为第(镇北村)的累计数之内,确定镇北村为第一个样本。
一个样本。
确定第二个样本:
确定第二个样本:
2273+3669=59422273+3669=5942,落在第落在第1010编号的累计数之内,确定清平村为编号的累计数之内,确定清平村为第二样本村。
第二样本村。
第三节非概率抽样第三节非概率抽样一、一、非概率抽样的含义的应用范围非概率抽样的含义的应用范围(一一)非概率抽样的含义非概率抽样的含义它是在不确定总体中,按照非随机原则它是在不确定总体中,按照非随机原则选取样本,并用这部分样本指标的调查结选取样本,并用这部分样本指标的调查结果,来判断总体指标的一种抽样类型。
果,来判断总体指标的一种抽样类型。
(二二)非概率抽样的范围非概率抽样的范围1.1.当对调查的总体不够清楚,或者太复杂当对调查的总体不够清楚,或者太复杂,不适于采取随机抽样时,那么,就需要用,不适于采取随机抽样时,那么,就需要用非随机抽样来抽出样本;非随机抽样来抽出样本;2.2.适用于经常性的调查和方便灵活的调查适用于经常性的调查和方便灵活的调查。
二、二、非概率抽样的方法非概率抽样的方法
(一)任意抽样法
(一)任意抽样法1.1.含义:
是指完全按调查者的意愿选含义:
是指完全按调查者的意愿选取样本的一种方法;取样本的一种方法;2.2.适用范围适用范围(11)可用于经常性的市场调查;)可用于经常性的市场调查;(22)可用于正式市场调查之前的试)可用于正式市场调查之前的试验调查;验调查;(33)任意调查适用于同质总体。
)任意调查适用于同质总体。
3.3.优缺点优缺点优点:
方便、灵活,简便易行,及时取优点:
方便、灵活,简便易行,及时取得所需资料,节约时间和费用成本低得所需资料,节约时间和费用成本低缺点:
因为个体差异性,抽样误差很大缺点:
因为个体差异性,抽样误差很大,结果不够可靠,应用价值较低。
,结果不够可靠,应用价值较低。
如进行现场访问,任意选择一群消费者如进行现场访问,任意选择一群消费者或者营业人员进行谈话,了解他们对商或者营业人员进行谈话,了解他们对商品质量的看法或购买动向。
品质量的看法或购买动向。
举例:
在街头向过路行人做访问调举例:
在街头向过路行人做访问调查;上门对一栋大楼内的每个公司进行访查;上门对一栋大楼内的每个公司进行访问式调查;在柜台销售商品过程中向购买问式调查;在柜台销售商品过程中向购买者做询问调查等(样本的选取完全随调查者做询问调查等(样本的选取完全随调查人员的方便而定)人员的方便而定)理论依据:
认为被调查的母体中的理论依据:
认为被调查的母体中的每一个个体都是相同的。
每一个个体都是相同的。
注意:
适用于非正式的探测性调查注意:
适用于非正式的探测性调查,或调查前的准备工作。
,或调查前的准备工作。
(二)判断抽样法
(二)判断抽样法1.含义:
又称目标抽样法,它是指由市场含义:
又称目标抽样法,它是指由市场调查的专家依据自己的判断来选取样本的一种调查的专家依据自己的判断来选取样本的一种方法。
方法。
2.适用范围:
总体的构成单位差异较大而适用范围:
总体的构成单位差异较大而样本数又很小的情况样本数又很小的情况3.优缺点:
优缺点:
优点:
因为是按照调查人员的需要来选优点:
因为是按照调查人员的需要来选定样本,所以较好地满足了特殊的调查需要定样本,所以较好地满足了特殊的调查需要。
缺点:
如果调查人员在选取样本时主观缺点:
如果调查人员在选取样本时主观判断出现偏差,则判断抽样极易发生较大的判断出现偏差,则判断抽样极易发生较大的抽样误差。
抽样误差。
(三)配额抽样法(三)配额抽样法1.1.含义:
是指按照一定的标准确定地区含义:
是指按照一定的标准确定地区别和职业别等不同群体的样本配额,然后别和职业别等不同群体的样本配额,然后由调查人员主观地抽取配额内样本的方法由调查人员主观地抽取配额内样本的方法。
配额抽样法和判断抽样法既有联系又有配额抽样法和判断抽样法既有联系又有区别区别二者的联系是:
二者的联系是:
配额抽样实质是一种配额抽样实质是一种“分层”判断抽样。
“分层”判断抽样。
二者的区别是:
二者的区别是:
(11)抽取样本的方式不同:
)抽取样本的方式不同:
aa配额抽样是分别从各个控制特征的配额抽样是分别从各个控制特征的层次抽取若干个样本层次抽取若干个样本bb判断抽样是从总体中的某一层次中判断抽样是从总体中的某一层次中抽取若干个符合条件的典型样本抽取若干个符合条件的典型样本(22)二者的侧重点不同;)二者的侧重点不同;aa配额注重“量”的分配配额注重“量”的分配bb判断抽样注重“质”的分配判断抽样注重“质”的分配(33)两者的复杂程度不同:
)两者的复杂程度不同:
a.a.配额抽样方法复杂精密配额抽样方法复杂精密b.b.判断抽样方法简便易行判断抽样方法简便易行2.适用范围:
通常适用于小型的市场调查适用范围:
通常适用于小型的市场调查步骤:
(步骤:
(1)选择“控制特征”作为细分)选择“控制特征”作为细分总体的标准;总体的标准;
(2)将总体按“控制特征”组成若干子总)将总体按“控制特征”组成若干子总体;体;(3)决定各子总体样本的大小;)决定各子总体样本的大小;(4)选择样本单位。
)选择样本单位。
非概率抽样和概率抽样的比较非概率抽样和概率抽样的比较抽样方法抽样方法作用作用抽样原则抽样原则应用应用优缺点优缺点非概率抽非概率抽样样研究总研究总体的局体的局部现象部现象非随机抽非随机抽出样本,出样本,主观性强主观性强可随时随可随时随地采用地采用不够科学不够科学规范,但规范,但省钱、省省钱、省事、灵活事、灵活方便方便概率抽样概率抽样以部分以部分推断总推断总体体随机抽出随机抽出样本,客样本,客观性强观性强只能定期只能定期采用采用科学规范科学规范,但费时,但费时、费钱、费钱、不够灵活不够灵活方便方便练习练习11某学校有职工某学校有职工140140人,其中教人,其中教师师9191人,教辅行政人员人,教辅行政人员2828人,总务后勤人人,总务后勤人员员2121人。
为了解职工的某种情况,利用系人。
为了解职工的某种情况,利用系统抽样方法从中抽取一个容量为统抽样方法从中抽取一个容量为2020的样本的样本答案:
答案:
1.1.将将140140人从人从11140140编号,编号,然后制作出有编号然后制作出有编号11401140的的140140个形状、个形状、大小相同的号签,并将号签放人同一箱子大小相同的号签,并将号签放人同一箱子里进行均匀搅拌,然后从中抽取里进行均匀搅拌,然后从中抽取2020个号个号签,编号与签号相同的签,编号与签号相同的2020个人被选出个人被选出.练习练习22一个单位的职工有一个单位的职工有500500人,人,其中不到其中不到3535岁的有岁的有125125人,人,3535岁至岁至4949岁的有岁的有280280人,人,5050岁以上的有岁以上的有9595人,人,为了了解这个单位职工与身体状况有关的为了了解这个单位职工与身体状况有关的某项指标,要从中抽取某项指标,要从中抽取100100名职工作为样名职工作为样本,职工年龄与这项指标有关,应该怎样本,职工年龄与这项指标有关,应该怎样抽取?
抽取?
答案答案2.2.为了使抽出的为了使抽出的100100名职工更充名职工更充分地反映单位职工的整体情况,在各个年分地反映单位职工的整体情况,在各个年龄段可按这部分职工人数与职工总数的比龄段可按这部分职工人数与职工总数的比进行抽样进行抽样.因为抽取人数与职工总数的比为因为抽取人数与职工总数的比为100100:
500=1500=1:
55所以在各年龄段抽取的职工人数依次是所以在各年龄段抽取的职工人数依次是即即25,56,19.25,56,19.第四节如何确定样本量第四节如何确定样本量一、影响因素一、影响因素1.1.研究目的及其重要性研究目的及其重要性2.2.总体的情况及其对精度的要求总体的情况及其对精度的要求3.3.抽样的方式抽样的方式4.4.变量个数以及数据分析的性质变量个数以及数据分析的性质5.5.发生率与完成率发生率与完成率6.6.资源的限制资源的限制二、在统计上样本量的确定二、在统计上样本量的确定置信度是指特定个体对待特定命题真置信度是指特定个体对待特定命题真实性相信的程度。
实性相信的程度。
允许误差是表明抽样指标和总体指标允许误差是表明抽样指标和总体指标的误差不超过一定范围。
的误差不超过一定范围。