作者简介:弗洛德 J.福勒,Jr.毕业于威斯莱安大学,于1966年获得密歇根大学社会心理学博士学位。此后,他大多数时间都是在马萨诸塞--波士顿大学的调查研究中心度过的。他在这个中心参加了许多调查项目的设计和施行,这些项目的主题极其广泛,包括:对地方政府和机构的态度、赌博、种族冲突、犯罪的恐惧、犹太人的识别、冒险的理解以及从健康计划中获得医疗服务的经历等。除此之外,还涉及其他更多的研究主题。最近他的方法论研究主要集中在以下三个领域:调查问题的设计和评估、如何减少调查资料里与访谈员有关的误差和如何测量医疗服务对病人的影响。他在哈佛的公共健康学院以及其它地方教授调查研究方法。他担任过调查研究中心的主任,长达14年之久。除了已发表的大量研究论文外,他还是《标准化调查访谈》(与T.W.Mangione合作)和《改进调查问题》两本被广泛使用的有关调查研究方法的专著的作者。
第二章 抽样
样本代表总体的程度是由样本框、样本规模以及抽样过程的特定设计决定的。如果使用的是概率抽样过程,样本估计值的精确度是可以计算出来的。本章描述了各种抽样过程以及它们对样本代表性和样本估计值的精确度的影响。本章更多叙述了两种最流行的人口抽样方法,即区域概率和随机电话拨号抽样。
有时,资料收集的目的不是为了获得有关总体的统计数据,而是要用更概括的方式描述一群人的特点。有时,新闻工作者、产品开发者、政治家等只需要大略了解人们的感情态度,而不太注意数字描述的准确性。如果研究者要进行小规模试验性研究以测量人们具有某种思想观点的广泛程度或者貌似一致实则不同的程度,那么那些便于找到的人(如朋友、同事)或自愿参与者(如杂志调查的应答者,电话公开的人们)就会显得很适用。并非所有的资料收集都需要严格的概率抽样调查,然而在多数情况下,进行调查的目的是为了展现有关总体的统计数据。本章关注的就是以产生统计数据为目标的抽样,这种抽样属于社会科学家可获得的各种形式的统计技术之列。虽然很多一般原则适用任何抽样问题,但是本章着重讨论的是人的抽样。
评估样本的方法不是通过结果和样本的特点,而是通过考查选择样本的过程。以下是样本选取的三个关键方面:
1.样本框是通过一定的抽样方法选定的一组有同样机会被抽取的人。从统计学上讲,样本只能代表包含在样本框中的总体。设计问题之一就是如何更好地使样本框与所要描述的总体保持一致。
2.概率抽样过程必须用来选择个体单元以组成样本。抽样过程必须使每个人都有被抽取的机会。如果研究者的处理或者回应者的特点影响到被抽取的机率,例如了运用便于找到的或主动自愿的回应者,那么就会失去评估样本代表性好坏程度的统计学的基础,通常使用的计算置信区间以评估样本的方法就不适用了。
3.样本设计的细节,诸如样本的大小以及选择单元的特定步骤等,都会影响到样本估计值的精确性,即影响到样本如何尽可能近似反映总体的特点。
这些抽样操作过程的细节,连同从被抽取的样本上能获得资料的比率,构成了评估一个调查样本质量所需的依据。本书第三章中将对回应率进行讨论,其中还将简要讨论定额抽样,它是对概率抽样的简单修改,这种抽样能产生非概率样本。本章将讨论抽样框、概率抽样过程,并介绍了几种行之有效的方法。对此有兴趣的读者可以在基什(Kish,1965)、萨德曼(1976)、卡滕(Kalton,1983)、格罗夫斯(Groves,1989)、亨利(Henry,1990)和洛尔(Lohr,1998)的著作中获得更多的相关知识。尽管准备进行调查的研究者经常会被建议去咨询抽样统计学家,但是,本章还是努力于让读者熟悉一些他们在评估调查抽样时会遇到的、应当予以关注的问题。
样本框
任何样本选取过程都会让一部分人有机会被抽取到样本中,而排除另一部分有同样机会的人进入样本。样本框是由这两部分有机会被抽取组成样本的人构成。评估样本质量的第一步就是明确样本框。大多数抽样设计属于以下三个层次之一:
1.抽样是在相对完整的总体名单中进行的。
2.抽样是在一群到某处或做某事的人(例如:接受医生治疗的人或是参加某个会议的人)中进行的。在这种情况下,抽样进行之前是没有名单的,名单的产生和抽样过程是同时进行的。
3.抽样是分成两个或多个阶段进行的,其第一阶段是对其他有关方面的抽样,而不是最终那种对人的抽样。通过一步或几步,实现基础的单元抽样,形成一份个体的或其它抽样单元的名单,再以此为基础实现最终的人员样本选择。一个最常见的这种抽样设计的例子是,在预先不知道哪些人居住在某些家庭单位的情况下,先选择一些家庭单位,然后再选择住在这些家庭单位里的人员样本。本章将在后面详细阐述这种分解段的抽样过程。
研究者应该评估样本框的以下三个特点:
1.全面性 一个样本只能代表一个样本框----有机会被抽样的总体。大多数抽样方法总会从所研究的总体中排出一些人。例如,以家庭为基础的样本就排除了那些住在诸如集体宿舍、监狱、疗养院等集体住处的人,也排除了那些无家可归的人。便于获得的常见人员名单诸如有驾照的司机、登记的选民、房屋所有者等将更具有这种排除性。虽然它们包括了某些总体的大部分,但却排除了重要的有独特特征的个体。一个典型的例子:公开的电话号码簿就排除了那些没有电话的人、要求不公开其电话号码的人以及在最新电话簿出版后才安装电话的人。在一些中心城市,几乎有50%的家庭会这样被排除掉。由此,从这些城市的电话簿里得到的样本只能代表大约一半的总体,并且可以不难断定,得到样本的这一半会在很多方面不同于另一半。
电子邮件地址提供了另一个典型的例子。有的总体,如在公司或学校的人,使用电子邮件就很方便。而对一般家庭总体使用电子邮件地址的抽样办法,就会排除很多人,产生的样本就会在许多重要方面与总体有很大的不同。
评估任何抽样设计的关键,是确定研究总体被抽样的机率和被排除的具有不同特点的人的范围。研究者会经常面临两难的选择:一个是简单便宜但会排除了一些人的方法;另一个是花费多但抽取的样本能更全面代表总体的方法。如果研究者想从已有的名单里抽样,特别重要的是要仔细评估这份名单以确定它是如何编制的、它的增删是何时及如何进行的,并要确定可能被排除在名单外的人员的数量和特点。
2.选择的概率 有可能计算出每个人被抽取的机率吗?在一年内就医记录的抽样中,就医次数多的人比只有一次就医经历的人有更高的被抽样机率。抽样设计没有必要给予抽样框中的每个人(如在名单中出现且仅出现一次的那种情况)相同的被抽取的概率。但重要的是研究者能够算出每个个体被抽取的概率,这些应该在通过核查抽样人员名单以选取样本时进行,也有可能在资料收集时进行。
在刚提到的通过就医次数来抽取病人样本的例子中,如果研究者询问被抽取的病人一年就医的次数,或者研究者能获得被抽取的病人的就医记录,都有可能在分析被抽样机率的基础上校正调查资料。但是,如果研究者不可能知道每个人被抽样的机率,也就不可能准确评估出样本统计数据与其总体之间的关系。
3.有效性 在有些情况下,抽样框包括了研究者不想研究的抽样单元,如果在资料收集时能识别出符合要求的个体,那么过于全面的样本是无可厚非的。因此,抽取家庭中老年人样本的最好的方法是将所有家庭都归入样本中,
找出那些有老年人的家庭后,再排除没有老年人的家庭。随机数字拨号抽样是以抽取电话号码(有些并未使用)作为抽取拥有电话的家庭样本的方法。这些设计的唯一问题就是它们是否合算。
因为从样本中进行概括的能力是由样本框所决定的,当研究者公布其结果时,他必须告诉读者哪些人被抽样哪些人被排除,以及被排除的人的特异程度。
抽取一阶样本
研究者决定了样本框或获得样本的途径之后,就应该决定怎样抽取包括在其中的个人单位。下面几节内容将讨论抽样者抽取样本的各种典型方法。
简单随机抽样
在某种意义上来说,简单随机抽样是典型的从总体中进行的抽样。所有计算样本统计数据的最基本方法都是假定抽取了一个简单随机样本。简单随机抽样类似于从帽子中摸出一个样品:一次选择一个总体的成员,每个成员是独立不能互相代替的;一旦某个单位被抽取,他就没有再被抽取的机会。
从操作上来讲,进行简单随机抽样需要一个编好号的总体的名单。只要确定每个人在总体中存在并只出现了一次就行了。假如一个名单上有8,500人,简单随机样本只要100个人,那么过程就很简单了:对名单上的人从1到8,500进行编号,然后使用电脑、一张随机数表或者其它产生随机数字的装置,就可以在同样的范围内产生100个不同的数字,与数字相对应的100人就组成了人数为8,500的总体的一个简单随机样本。如果名单是电子档案形式的,就先把名单随机排序,然后选择新名单上的前100 人,这样也会产生同样的结果。
系统抽样
除非名单很短、所有的抽样单元都先编好号,或者都可方便地用电脑操作进行编号,否则上述简单随机抽样的方法用起来就会十分吃力。在这种情况下,可以使用另一种抽样方法即系统抽样。系统抽样与简单随机抽样具有相同的精确性,并且操作方便。另外,系统抽样便于使分层的优越性体现出来(下部分将予以讨论)。
当从一个名单中选出系统样本时,研究者首先要决定名单上项目的数量以及要抽样的项目的数量,然后用后者除以前者。这样,假如名单上有8,500人,样本只需100人,名单人数的100/8,500会被包括进样本(即从每85个人中选出1个)。先在样本间距里选择一个随机数,在本例中就是从1到85中的任意一个数字,随机定的起点保证了它是一个机会抽样过程;从随机最初选出的那个人起,研究员就可以按名单每数85个人就挑1个出来。
大多数统计学著作都提请注意,如果名单是按某些特征排序或者有一种循环格局的情况时,即使是随机的起点,系统样本也会受到明显影响。有一个极端的例子,在一个夫妇俱乐部的成员名单里,如果丈夫的名字总是排在妻子前面,那么不管是任何偶数的间距,总会产生一个只有一种性别的系统样本。在检测一个可能的样本框时,注意到由一个随机起点产生的样本是否会与由其它随机起点产生的样本对调查结果有系统的不同影响,是十分重要的。在实践中,大多数名单或和样本框不会产生不适合于系统抽样的问题。果真问题出现时,只要调整名单或抽样间距,通常情况下是可以设计出至少可与简单随机样本相媲美的系统抽样方法的。
分层抽样
当抽取简单随机样本时,所抽取的个人是独立的,不受先前已经抽取的其他个人的影响。这一过程有时会导致样本的一些特点与其总体不同。一般说来,在资料收集以前,很少知道总体中个人的特点。然而,有一些总体的特点经常在抽样时就能得到确认。在这种情况下,有可能重新计划抽样程序以减少常规抽样的变异,以便形成一个比简单随机样本更接近于总体特征的样本。达到这个目的的过程被称作分层。
例如,某研究者有一个大学生名单,其中姓名是按字母排序的,名单里不同班级的学生名字混杂在一起。如果名单标明了每个学生所属的班级,就有可能重新将名单排序:把大一学生排在最前面,接着是大二、大三,最后是大四的学生,并且所有的班级都组合在一起。如果抽样设计要求在名单中每10个学生中选出1个,重新排序后的名单就能保证有1/10的大一学生被抽样,有1/10的大二学生被抽样,依次类推。如若不然,而是用原来的字母排序名单形成简单随机样本或系统样本,那么大一的样本比例就由标准抽样变异决定,它会比其在总体中的实际比例更高或更低,而提前分层就确保了抽样比例与实际比例相同。
现在来考虑一下评估学生平均年龄的工作。由学生组成的班级几乎可以肯定是与年龄有一定关系的。尽管由于抽样过程的原因,在样本评估中会存在一些可变的因素,但是在抽样框中注意班级的代表性,可以抑制样本平均年龄偶尔出现与总体有差异的程度。
几乎所有以地理区域为总体的样本都可以依据某些区域变量进行分层,这样做可以使它们类似于将总体作为一个整体同样的方式进行抽取。国家样本是典型地通过国家的不同区域或按城市、市郊和乡村分层进行抽样的。虽然分层只增加了与分层变量有关的变量值评估值的精确度,但是由于某些层次的分层相对来说简单易行,并且它从不会降低样本评估值的精确性(只要所有层次中所用的是同样的概率抽样),因此分层抽样通常是样本设计的一个亮点。
不同概率选择
有时分层被用作改变总体中各种子总体抽样率的第一步。当各个层次都实行概率抽取时,一个占总体的10%的子总体,也会构成样本的10%。如果研究者想从占总体10%的子总体中选出至少100人的样本,那么简单随机抽样法需要一个总数为1,000人的样本;如果研究者打算将子总体的样本规模扩大到150人,那么就需要追加500人到总的样本中,使总的样本规模达到1,500人,这样才能使总样本的10%等于150。
明显可以看出,有时以这种方式增加样本是费时、费力又不怎么有效的。在上面的例子中,即使研究者对其它子总体的样本规模满意,只为了增加50个有用的调查对象设计一个子总体样本,也不得不同时增加450个不需要调查者以备抽取。因此,在有些情况下,合理的设计方法是让某些子总体有比其它的子总体更高的抽样率。
例如,假设研究者想在一所男生仅占20%的大学里,却至少要用200个男生来对比男女学生的情况。这样,500人的样本中应该有100个男生。但是如果能事前区分出男生,就可以将男生的抽样机率提高为女生抽样机率的2倍。这样不用再加500人以从中再选出100个男生,就可在原来的那500人样本基础上另增加100个男生,组成200人的男生样本。由此,当进行男女生比较时,就会得到200男生和400女生作为调查对象,其精确度不会下降。为了组合这些样本,研究者应给予男生的权值为女生的一半,因为男生的抽样机率是女生的2倍。
在下面列表的表格里,可以看到被调查者中有33.3%的是男生(600人中选出200人)。但是采取了加权的办法后男生组成了加权后样本的20%,这就与他们在总体中的所占比例相等。
即使对所关注的子总体中的个体不能在抽样前了解清楚,有时也能应用这里提到的基本方法。例如,一般不可能在接触前就获得确认了居住者种族的家庭名单。然而,亚裔家庭通常比其他种族的人居住更为集中。这种情况下,研究者就可以用高于平均数的比率抽取亚裔占优势地区的家庭,以增加亚裔调查对象的数量。
女生 男生
总体的人数 4,000 1,000
在总体中所占比例 80 20
抽样分数 1/10 1/5
样本中的人数 400 200
样本里没有加权处理的比例 66.7 33.3
加权(以调整概率选择) 1 1/2
样本里加权处理后的人数 400 100
样本里加权处理后的比例 80 20
再次强调,任何子总体与总体中的其它子总体的抽样率不同时,为了使组合的或总的样本产生关于总体的准确的统计值就需要进行适当的加权处理。
第三种方法是在与有可能成为调查对象的人接触而收集到的资料基础上调整抽样率。仍以上述大学生调查为例,假设事先不能查明学生的性别,研究者可以选择一个有1000名学生的初始样本,让访谈者把每个学生的性别查明,然后对所有被选的男生(200)和一半的被选女生(400)进行访谈。其结果也会与刚才谈到的表格里的结果一样。
最后,应该指出在不同层面使用不同抽样率的另一个技术上的原因:如果一个组群在所测量内容上与另一个组群有很大的不同,那么,相应地对这个组群进行过度抽样,将有利于提高最终整体评估值的精确性。格罗夫斯(Groves,1989)很好地阐述这一基本原理,并提供了评价这些设计的效度的方法。
多阶抽样
当没有合适的总体成员名单,并且没有办法直接把握总体时,多阶抽样就成为一种很有用的抽样方法。
没有可直接抽样的来源,就需要一种将总体中的成员与某种能够进行抽样的分组联系起来的策略。第一阶段先对这些分组进行抽样,然后再由所选定的这些组的成员形成名单,以便能在后续阶段能从这些名单中再进行抽样。在抽样术语学上,抽样设计的第一阶段里分出的那些组通常被称为“整群”。下面通过介绍在名单不可得的三种最普通的情况下对多阶抽样的使用,说明多阶抽样的一般策略。
从学校里抽样学生
要从某城市的公立学校中所有注册在读的学生里抽出一个样本,却找不到这些学生的一个完整名单,是常有的事情。然而有一种抽样框可以让研究者把握所需总体的所有学生的情况:即关于那座城市里所有公立学校的名单。因为研究总体中的每个学生都只与一个学校有联系,所以关于学生满意的完整样本就可以通过使用二阶策略抽样获得:首先选择学校(即整群),然后从那些学校里选择学生。
假设有以下资料:
城市里有40个学校共有20,000名学生
目标样本=2,000=1/10的学生
那么将有如下四种抽样的设计或方法,其中每一种都会产生2,000人的概率样本:
第一阶段的选择概率 × 第二阶段的选择概率 = 总的选择概率
(学校) (在所选学校里的学生)
a)选择所有学校列出所有学生,1/1× 1/10 = 1/10
然后在每个学校选择1/10的学生
b)选择1/2的学校,然后在 1/2× 1/5 = 1/10
其中选择1/5的学生
c)选择1/5的学校,然后在 1/5× 1/2 = 1/10
其中选择1/2的学生
d)选择1/10的学校,然后收 1/10× 1/1 = 1/10
集其中所有学生的资料
以上四种方法都将产生2,000人的样本,都给予每一个学生同样的(1/10)抽样机率。四种方法的不同在于:从第一种到最后一种,越来越能节约经费,获得名单所需的学校越来越少,需要走访的学校越来越少;同时,样本的精确度会因抽取的学校更少和每所学校里抽样的学生更多而降低。有关诸如此类的多阶抽样设计对样本评估值精确度的影响,将在本章后面进行更详细的讨论。
区域概率抽样
区域概率抽样因其广泛适用性而成为多阶抽样策略中最常使用的方法之一。它可以用来抽样以地理区域性划分的任何总体,诸如住在某个地区、某个城市、某个州或某个国家的人们。基本方法就是将所有对象区域划分为全面彻底、互相排斥、界限明确的子区域,这些子区域就是整群,由子区域组成的样本也就此产生;再由选定的子区域里的家庭单元组成一个名单;然后,抽取写在名单上的家庭单元组成样本;最后一步,是用抽取的家庭单元的所有成员组成样本,或者进一步用这些成员的名单再次进行抽样。
这种方法适用于丛林、沙漠、人烟稀少的乡下或大城市的中心区。抽取这种样本的详细步骤可能十分复杂,但是,通过描述如何以城市街区为子区域单位抽取城市总体样本能够阐明其基本原则。假设有以下资料:
一个城市有400个街区
共有20,000个家庭单元住在这些街区里
目标样本=2,000个家庭单元=1/10的所有家庭单元
考虑到这些信息,可选择与从学校抽取学生样本相似的方法去抽取家庭样本。抽样的第一个阶段,选定街区(即整群)。在第二个阶段,列出被选定街区里的家庭单位名单,从名单里抽取样本。接下来介绍两种抽取家庭单元的方法。
第一阶段的抽样概率 × 第二阶段的抽样概率 = 总的抽样概率
(街区) (选定街区的家庭单元)
a)选定80个街区(1/5),1/5 × 1/2 = 1/10
再选出这些街区里1/2的单元
b)选定40个街区(1/10),1/10× 1/1 = 1/10
再选出这些街区里所有的单元
与学校抽样相类似,由于第一种方法比第二种所选定的街区更多,因此,成本更高,能获得比规定规模更精确的估计值。
没有任何一个设计在选择抽样方案时考虑到了第一阶段的组群规模(例如,街区或学校的规模)。规模大的和规模小的学校或街区有同样的抽样率,因此,在最后一个阶段,每个被抽样的组群都有一个固定的分母,那么与小的学校或街区相比,大的学校或街区的访谈的数量将更多。在第二阶段,样本的规模(整群规模)就会有相当大的不同。
如果有关于第一阶段抽取的组群规模的资料,那么对这些资料予以运用往往是有益的。如果在抽样的最后一步中选定的单元数量在所有的整群中都相同,那么样本的设计将产生更精确的估计值。这种设计方案的优点还在于能更容易计算出抽样误差,并且更容易预见样本的总体规模。为了产生同等规模的整群,在第一阶段进行单元抽样时,要与它们的规模成比例。
接下来的例子展示了根据街区规模来按比例进行抽样的方法。它是以区域概率法作为对家庭单元(公寓或个人住房)进行抽样的第一步。这种方法也适用于学校抽样,只要把学校当作街区就可以了。
1.确定在抽样的最后阶段要抽取的家庭单元的数量,即平均的整群规模。例如选10个。
2.对第一阶段抽取的每个街区所包含的家庭单元数量作出估计。
3.给街区排序,以便把地理位置邻近或相似的街区排在一起,这是为提高样本的质量而进行的划分。
4.产生所有街区家庭单元的评估累计数,最终将形成以下表格:
街区号 家庭单元估计数 家庭单元的累计数 得分
(随机起点=70,
间距=100个家庭单元)
1 43 43 -
2 87 130 70
3 99 229 170
4 27 256 -
5 15 271 270
5.决定整群的间距。如果要从10个家庭单元中选出1个,并且在每个选定的街区中选择一个由10个家庭单元组成的整群,就需把整群的间距定为100个家庭单元。换种方法,我们不从每10个家庭里选出1个家庭,而从每100个家庭里选出10个家庭,选择率是一样的,但是使用的方式是“整群的”。
6.在从1到100(本例的间距)随意选择一个数字作为起点,进而按照累计数系统地进行,标明在第一阶段抽样的最初的单元数(街区)。在本例中,随机抽样的起点(70)就跳过了第1街区(有43/100的被抽中的机率),第70个家庭单元在第2街区,第170个家庭单元在第3街区,第270个家庭单元在第5街区。
由被选定的街区(第2,3,5街区)的家庭单元组成的名单,通常是派人对这些街区进行走访形成的。接着就是从这些名单中选择出家庭单元。如果能确保对这个街区规模的估计值是准确的,那么研究者就可使用简单的随机抽样或系统抽样在每个选定街区中选出10个家庭单元。一般认为系统抽样是最好的,因为由此选定的单元会分布在整个街区。
对第一阶段抽样单元(例如街区)规模的评估通常有误差,可以通过计算从街区中所选择的家庭单元的抽样率来修正这些误差,例如:
街区家庭抽样率=整群的平均规模/街区家庭单元的估计数=10/87=1/8.7(在第2街区里)
本例中,在第2街区,我们可以在每8.7个家庭单元里抽取1家;在第3街区,每9.9个家庭单元里取1家;在第5个街区,每1.5个单元取1家。如果某街区规模比预想的大(例如,进行了新的建设),所抽取的样本就不止 10家;如果它比预期的小(例如拆迁),所抽取的样本就少于10家;如果与我们预想的一样(例如,第2街区中有87个家庭单元),我们就选10个(87÷8.7=10)家庭单位。通过这种方式,就可以在抽样的过程中自动修正最初对街区规模评估的误差,同时使得所有街区中的家庭单元都有同样的被选择的机会。不管是估计的还是实际的街区规模,任何家庭被选择的机率都是1/10。
区域概率抽样法可以用来对任何以地域划分的总体进行抽样。虽然区域越大,步骤就会越复杂,但是方法都是一样的。要记住以下的关键步骤:
-
所有区域都必须给予一定被抽取的机会。将预计没有任何符合条件的抽样单元的区域与相邻的区域结合起来以保证获得抽样机会。在这个过程中可能会因为有了新的建设或评估本身的偏误而产生误差。
-
街区(或其它类的地区)的抽样概率与从样本街区里抽取家庭单元的概率之积,在所有街区应该保持相同。
最后,即使是细心的现场制表人也会漏掉一些家庭单元。因此,在资料收集时注意核查、防止遗漏是必要的。
随机数字拨号
随机数字拨号(RDD)是另一种抽取家庭单元以便抽取这些家庭成员样本的方法。假设有6个电话局覆盖了20,000个家庭单元,研究者可以从拥有电话的10%的家庭单元中抽取概率样本:
1.在6个电话局里,大概有60,000个电话号码(每个电话局有10,000个)。选出6,000个(即10%),也就是从每个电话局中任意抽取1,000个4位数的电话号码。
2.拨打6,000个号码。并非所有的号码都是家庭电话号码;实际上还有许多无用的号码、连接不通暂时无法使用或是商业电话。由于该区域内有10%的电话都被打通,因此,在这个地区大约10%的拥有电话的家庭能够通过拨打电话进行联系。
这就是最基本的随机数字拨号抽样方法。此法最明显的不足就是有大量的无用电话。在全国范围内,最多有25%的是家庭住宅号码,在城镇地区大概有30%,在农村大概只有10%。瓦克斯伯格(Waksberg,1978)建立了一种依据电话号码分组的方法。每组包含100个电话号码,每个电话号码由3个区位号码,3个电话局的号码和2个附加码(区位号码-123-45XX)组成的。首先,在一个样本中任意拨打号码以便对其进行初步筛选;接着,便在家庭住宅号码组中再任意拨打,这样家庭单元被抽中的机率就可以被提高到50%以上。在这个设计中,100个电话号码构成的组就是“整群”。
近些年来,大多数调查机构开始使用名单辅助法进行随机数字拨号。随着电脑技术的发展,公司可以编辑电子电话薄,这些电子电话薄每3个月更新一次。一旦所有的电话薄都是以电子文件的方式存在,就可以搜寻到至少有一个公开(出现在电话薄上的)住宅电话号码的所有整群(区域码-123-45XX)。这些公司就可将这些在组群中至少有一个公开住宅电话号码的所有电话号码组成一个样本框,然后利用这个样本框进行抽样。这种方法有两个优点:第一是瓦克斯伯格(Waksberg)方法里所要求的电话号码的最初的删筛工作就不再需要了,因为编好的样本框已经完成了这项工作。第二是使用这个样本框选好的样本不再需要分组了。通过使用包含了所有的住宅电话号码整群的样本框,就可对电话号码进行简单随机抽样了。这种新方法比以前的方法更加经济有效。其局限在于,在整群中,没有被列出的住宅号码就没有被抽中的机会。布里克(Brick),Wakesberg,库尔普(Kulp)和斯塔尔(Starer)(1995)估计在美国平均有4%的有电话的家庭不在名单内。列普克夫斯基(Lepkowski,1988)对以家庭抽样为目的的各种电话号码抽样方法进行了详细的总结。
另外,在使用随机数字拨号抽样方法时,还应该注意一些问题。首先,它的使用价值是建立在大多数家庭有电话的事实基础之上的。在全国范围内,大概只有5%的家庭没有电话,但是在一些地区,特别是中心城市或乡村地区,遗漏率可能更高。桑贝里(Thornberry)和马西(Massey,1988)对那些有和无电话的家庭的不同做了进一步的分析。
随着手机使用率的上升,家庭座机使用率下降,RDD抽样将面临一个问题:普通的RDD抽样只关注家庭座机而避免对使用手机的家庭进行抽样。对两种方式都进行抽样是可行的,但是假如将手机抽样加入抽样框,抽样、资料收集和调查后的加权就会变得十分复杂。
对RDD抽样提起另一个挑战是,如何找到在与地区边界不相符的电话局内进行小地区抽样的方法。除非能确保电话号码与研究区域相一致,否则访谈员就需要回应者告诉他们是否住在调查区。当回应者住在一个难以界定的地区时(例如,邻近地区)就很难保证抽样的可靠性。
像其它抽样方法一样,对所有的调查而言,随机数字抽样并不是最佳选择。对其赞成和反对的观点将在第四章进行详细讨论。无论怎样,在过去的30年里,作为抽样方法之一的随机数字抽样方法的引入,为调查研究水平的提高作出了重大贡献。
选择回应者
区域概率样本和随机数字拨号样本都是对家庭单位进行抽样,因而,下一个问题就是由家庭里的哪些人来接受访谈。
最佳的选择取决于所收集信息的种类。在某些研究中,要对家庭情况及其所有成员的信息加以收集。如果要求回答的问题很简单,那么就可以选择这个家庭里的任何成年人进行回答;如果要求所作的回答是专门的,访谈员就应该对家庭中知识最渊博的人进行访谈。例如,在国家健康访谈调查里,家庭里 “最了解家庭健康状况”的人将被作为涉及家庭中所有成员的问题的回应者。
但是,很多人都只能说出关于他(她)自己的事来。大多数研究员普遍认为没有任何人可以说出他人的感受、观点和知识。还有一些通常只有自己才能准确说出的行为和经历(例如:吃喝的东西、所买的物品、看见或被告知的事物)。
当研究包括的变量只有通过自我讲述方式才能获得时,抽样过程除了选定家庭之外,还必须从这些家庭中抽取特定的个人。一种方法就是与家庭中的每个符合条件的人进行访谈(此时,不进行任何抽样)。除了前一个回应者的答案会影响后一个人的回答之外,由于整个家庭具有同质性,最常用的方法就是每个家庭只选择一个回应者。很显然,选择那些恰巧接电话或开门的人作为回应者是一个非概率抽样和存在潜在偏误的选择样本的方式。访谈员的处置权、回应者的处置权以及有效性(与工作地位、生活方式和年龄相关)都会影响到谁将成为回应者。概率抽样的重要原则就是通过随机抽样来选定具体的人。在家庭内运用概率选择回应者的过程包括以下三个步骤:
1.明确家庭里有多少人适合作回应者(例如,有几个18岁或18岁以上的人)。
2.对所有家庭以同一种方式进行编号(例如,按降序排列年龄)。
3.要有一个客观的选择回应者的过程。
基什(Kish,1949)编制了一个通过使用随机调查表选择回应者的详细步骤,此表至今还在使用。当有电脑辅助访谈时,让电脑来选择合适的家庭成员是很容易的。这个过程重要的特点是没有人为的处置权的干扰,在被选定家庭里,所有符合条件的人都有被选中的可能。格罗夫斯和利伯格(Groves and Lyberg,1988)对几种简化回应者选择过程的策略做了评论。
当一个家庭只访谈一个人时,则需要引入选择的差异率概念。如果一个家庭只有一个成年人,很显然当选定这个家庭时这个成年人将会成为回应者;如果一个家庭有3个成年人,就只有1/3的机会被抽样。无论何时,为了避免被过分抽样的人的资料在样本统计数据中过多出现,就必须对一个以不同于其它组的比率进行抽样的那个组进行加权处理。在本章的前半部分有个例子,当男生的抽样率是女生的两倍时,他们的回答就得乘以权值0.5,以便他们的被加权的样本的比例与总体中的比例相同。当从具有不同数量的符合要求的人的家庭中选择一个回应者时,可以使用同样的方法。
调整对每个家庭选择一个回应者的影响的最简单方法是根据那个家庭中符合条件的人的总数给每个答案加权。因此,如果有三个符合条件的成年人,那么权值为3;如果有两个成年人,权值就为2;如果只有一个符合条件的成年人,权值就为1。如果加权方案是合适的,那么对于所有的回应者来说,抽样概率乘以权值的结果也是一样的。
还有一些变量与家庭中成年人的数量紧密联系。例如,结婚的人比单身的人更有可能会住在至少有两个成年人的家庭里。已婚者与单身者在很多方面都有所不同,因此假如数据不被进行加权处理,那么任何与婚姻状况相关的评估都将是不准确的。
也有一些变量与家庭里的成人人数没有关系,在这种情况下,加权也不会对描述性的结果产生影响。当需要产生描述性统计数据时(例如均值或分布),一般通过加权来调整家庭和/或成人抽样的差异率。此外,为描述性目的而进行的加权对很多标准分析程序包来说是十分容易的。但是在加权资料基础上使用统计数据测试的过程会十分复杂。在统计数据测试中用到的估计值除了其它的样本设计特点外,还与实际回应量相联系。如果对一个项目的观察比它实际上应得到的更多或更少,使用权值可能会使运算出错。有时当调查的设计很复杂时想要准确地进行统计数据测试是很困难的。而且对一些相关分析,没有必要进行加权(Groves,1989)。这是需要抽样统计学家对调查资料进行合理设计和分析的重要性的又一个例证。
从样本和抽样误差中得到估计值
以上提到的抽样策略被选择的原因是它们的使用极其普遍,并且显示了抽样设计选择的主要取向。一个概率抽样方案最终会在没有研究者或回应者的处置权的情况下选出一组家庭或个人。研究者所能使用的基本工具就是简单随机抽样和系统抽样,它们都可以通过分层、不等的抽样率和整群对其加以完善。抽样策略的选择部分地是由其可行性和成本所决定的,同时也包括了对样本估计值精确性的考虑。使用概率抽样方法的主要原因是可以使用各种统计工具去评估样本估计值的精确性。在这一部分,将对样本估计值的计算方法及其受样本设计特点影响的方式进探讨。
研究者常常对样本本身的特点不感兴趣,收集样本的资料是为了得到反映总体的结论。本章对统计和设计问题的讨论,就是以探讨样本特征能精确描述总体状况的程度为出发点的。
有许多形象化的描绘被用来解释概率理论。可能其中最容易理解的就是掷硬币的方法。如果一个质量均匀的硬币被掷出了10次,不一定恰好是5个正面和5个反面,有时是6个正面、偶尔是7个正面,甚至还会出现10个正面。本质上讲,你可以把10次掷硬币的活动认为是许多可能的样本。如果完成一系列的10次掷硬币活动,在掷了10次后记下硬币正面出现的次数,再掷10次再记录下硬币正面出现的次数,一直这样做下去,就会产生一个分布图。如果是质量均匀的硬币,10次掷硬币得到正面的次数,更多的是5次。围绕5次正面向上就会出现一个分布图,10次向上或一次都不向上的极端状况出现的频率最低。
虽然调查中有些误差来源是由于偏误并产生了系统性的数字失真,但是抽样误差一般是由抽样的随机性引起的(因此不是系统性的偏误)。当用概率抽样法选取样本时,可能能够计算出由于抽样而引起样本估计值偶然变化的幅度。
如果对抽取的样本的数量没有限制,描述性统计的样本估计值(例如,均值)就会正常分布在真实的总体值的周围。样本规模越大、测量内容的变动性越小,样本估计值就越能地集中分布在真实的总体值周围,并且以样本为基础的估计值就会越精确。围绕真实总体值的变化(源于样本和总体之间的偶然差异)被称为“抽样误差”。针对随机抽样的易变性,确定样本评估的信度是评估调查数据质量的重要组成部分。
选择样本的设计(尤其是它是否含有分层、整群或不等概率抽样)会影响对一定规模的样本抽样误差的估计值。但是,通常描述抽样误差的方法,是看在简单随机抽样中它们可能以什么形式出现,然后计算出简单随机抽样设计中离差的影响。因此,首先要介绍简单随机样本抽样误差的计算。
简单随机样本中的抽样误差
虽然本书不是关于抽样统计的教科书,然而,对某个样本设计误差的评估却是调查设计过程的基本组成部分,并且研究者通常向读者提供关于把误差归因于抽样的一些准则,这些准则是专业读者和调查研究资料的使用者都应该知晓的。因此,对计算抽样误差方法的认识是了解整个调查过程的必要组成部分。
尽管同样的逻辑适用于一个样本的所有统计数据,但是最常用的样本调查估计值是均值或平均数。经常用来描述抽样误差的统计数据被称为标准误差(一个均值),它是按一定规模抽取的巨量样本的均值估计值分布的标准离差。标准误差值一旦确定,人们就可以说一定规模和设计的样本均值67%是在真实的总体均值±1的标准误差范围内,有95%会在真实总体值±2标准误差周围内。后面一个数字(±2标准误差)通常被称为样本估计值的“置信区间”。
对一个均值的标准误差的评估是通过计算方差和被评估的样本规模得出的。
SE=均值的标准误差; Var=样本离差的平方之和,即方差;n=样本大小
从样本调查中计算出来的最常见的均值可能是一个比值,即有某种确定特点或给出了某种回应的样本的百分数,它在表明两个数值分布均值的比例上很有用途。
均值就是平均数,它的计算方法是将总值除以事例总数:∑X/n。现在假设只有2个值0(否)和1(是),某样本中有50个成员,当问到是否结婚时,有20个人说是,其他的说否。如果有20个“是”和30个“否”的回答,就可这样计算均值:
∑X=(20×1)+(30×0)=20 ∑X /n=20/50=0.40
一个比例陈述,例如有40%的回应者结婚了,恰恰是关于1或0(即回答“是”或“否”,1=是,0=否,译者注)的分布均值,均值为0.40。可以根据通过p×(1- p)计算出的比例的方差,然后很容易地计算出比例的标准误差,p即是具有某种特征的部分(例如,例子中有40%的人已婚),(1- p)即是样本中没有某种特征的部分(例如,60%的人未婚)。
我们可以看到均值标准误差的公式:
因为p(1- p)是一个比例的方差,所以比例的标准误差计算公式变为:
在前面例子中,50人中有40%的人已婚,其标准误差的计算方法如下:
因此,我们可以估计真实总体数(整个总体中已婚比例)在0.33到0.47(0.40±0.07)之间概率是0.67(即样本均值±1个标准误差);有95%的把握说总体的真实值在样本均值的两个标准误差之间,即在0.26和0.54(0.40±0.14)之间。
表2.1是关于不同规模和不同比例的样本抽样误差的概括性表格,表中所提供的样本是通过简单随机抽样产生的,表里出现的所有数字代表了一个比例的两个标准误差。考虑到对做了某种回应的样本比例的估计,表格为不同样本规模提供了95%的置信区间。在例子中,50个人中得出了有40%的人已婚的样本估计值,正如我们所计算的,表格提供的置信区间在0.14左右。如果100个人里得出了20%的人已婚的估计值,表格显示我们有95%的把握说真实值是在20%±8%的区间内(即12%到28%)。
表中提到的几点都要加以注意。首先,可以看出样本越大产生的抽样误差越小。第二,也可以发现,当我们对样本的数量进行补充时,能减少样本误差,规模小的样本比规模大的样本误差的降幅要大。例如,将50个成员加入规模为50的样本中,就会使误差明显降低。但是将50个成员加入到规模为500的样本中,它对增加整个样本估计值的精确度所起的作用几乎看不出来。
第三,可以看到,抽样误差的绝对值在比例为0.5左右时最大,当具有某种特点的样本比例达到0或100%的时,抽样误差的绝对值会下降。可以看到标准误差与方差有直接联系。当比例越远离0.5时,方差p(1- p)就会越小。
第四,表2.1和它所基于产生的公式适用于简单随机抽样所产生的样本。一般总体的大多数样本不是简单随机样本,样本设计对计算抽样误差的影响程度,会因同一调查里的不同设计和不同变量而有所不同。通常,表2.1会对普通总体样本的样本误差做出保守的估计。
表2.1
抽样变异导致的不同置信区间 *
有某些特点的样本的比例 |
样本规模 |
5/95 |
10/90 |
20/80 |
30/70 |
50/50 |
35 |
7 |
10 |
14 |
15 |
17 |
50 |
6 |
8 |
11 |
13 |
14 |
75 |
5 |
7 |
9 |
11 |
12 |
100 |
4 |
6 |
8 |
9 |
10 |
200 |
4 |
6 |
8 |
9 |
10 |
300 |
3 |
4 |
6 |
6 |
7 |
500 |
2 |
3 |
4 |
4 |
4 |
1,000 |
1 |
2 |
3 |
3 |
3 |
1,500 |
1 |
2 |
2 |
2 |
2 |
注释:在给定有特点的样本的比例以及产生这个比例的样本的规模的情况下,机率是95%的实际总体值取决于在表中值域的增减数。
*本表描述了抽样的易变性。源于无回应或报告错误的误差在本表中没有反映。此外,本表假定所采用的是简单随机抽样样本。由于样本设计或其它方面的影响,估计值或许比本表所反映的值更具有易变性。
最后,要强调的是,表2.1中所描述的是源于抽样的潜在误差的易变性反应,而与总体中每个个体的信息收集无关。这个计算没有包括来源于调查过程其它方面的误差估计值。
其它样本设计特点的影响
前面讨论了简单随机抽样误差的计算方法。抽样误差的估计值会受不同抽样方法的影响。如果没有分层,系统抽样产生的误差会与简单随机抽样相同;如果每一层的抽样率是一样的,那么对于同规模的样本来说,分层样本抽样误差比随机抽样样本的要低。
不等抽样率(以不同的抽样率从总体中抽取子群)的设计,是为了增加过分抽样的子群的估计值的精确度。
-
形成总体样本时,一般情况下,对子群的过度抽样会比用简单随机抽样抽取同样规模的样本产生的抽样误差高;
-
如果分层中某些变量变异性较大,那么,用过度抽样导致的那些变量的总体抽样误差会比用简单随机抽样小。
整群抽样产生的误差比同规模的简单随机抽样的误差高,其原因是变量在整群中的同质性比总体的高。同样,最后阶段整群的规模越大,通常对抽样误差的影响也就越大。
一般情况下很难预料到设计特点对估计值精确度的影响。设计影响会由于研究的不同和同一研究中变量的不同而有所不同。举例来说,假设在各个选定的街区中的每座房屋的建筑类型是相同的,也不知它们是否被哪个人拥有。这样,一个街区的某个应答者报告说自己是一个住宅的主人,那么对这个街区的其它访谈就绝不会获得关于在总体中房屋所有权比率的更多资料。正是这个原因,不管研究者对一个街区只调查一家还是调查20家,其估计值的信度都是一样的,基本上与进行访谈的街区的数量是成比例的。另一个极端情况是,某街区里成年人的身高差异与整个城市成年人的身高差异相同。当某街区回应者的同质性与总体相同时,整群抽样不会降低一个给定的身高样本估计值的精确度。因此,为了估计整群抽样对抽样误差的可能影响,研究者应该注意整群或分层所具有的特点以及要得到的样本估计值的种类。
样本设计对抽样误差的影响经常不受重视,经常会看到一些关于置信区间的研究认为,当使用整群抽样时,就可以采用简单随机抽样方式。想要提前知道设计影响的大小是十分困难的。正如所提到的那样,样本设计对抽样误差的影响就每个变量来说都是不同的。当样本设计不是使用简单随机抽样时,如使用整群和分层,这些计算尤其复杂。因为计算抽样误差的能力是运用调查方法的最重要成组成部分之一,因此,让统计学家参与具有复杂样本设计的调查,以确保能计算并恰如其分地告知样本误差,是十分重要的。当评估样本误差时,对设计特征的适当考虑被极大地简化了,因为有几个现成的分析程序包将会对此加以调整。
最后,只有把样本设计的特点放在所有调查目标里考虑才能评估出它的合理性。整群抽样可以节约抽样(名单)和资料收集的成本,并且它往往对许多变量的抽样误差影响不大。过分抽样一个或多个组群经常是一个很划算的设计。像在本书提到的很多问题一样,对一个研究者来说,重要的是要意识到所作选择的潜在的成本和效益,并把它放到所有可供选择的设计中、结合调查的主要目的加以衡量。
样本的规模应该多大?
对一个调查方法学家而言,在诸多样本设计包括的问题中,最普遍的问题之一是样本的规模应该是多大。在提供答案之前,也许最好是先谈谈三种普遍但不是很恰当的确定样本规模的做法。
一个普遍的误解认为,样本的适宜性在很大程度上依赖于包含在样本中的总体的分数——或者是总体的1%、5%,或者其它比例,这个比例决定着样本的可靠性。已有关于抽样误差的估计值的讨论,没有考虑到包含在样本中的总体的分数问题。前面的公式和表2.1中得到的抽样误差估计值,可以通过乘以(1-f)使其降低,其中f = 样本中所包含的总体的分数。
当研究者对总体的10%或更大比例进行抽样时,这个调整对抽样误差的估计值有明显影响。然而,大多数样本即使再大也只包括了总体中很小的一部分,在这种情况下,样本中包含的总体的分数即使增加一点,不会影响研究者从样本推断总体的能力。
也该注意到与这个原则相反的方面。总体的规模对于从中选出的一定规模的样本能否很好地描述总体并没有实质性影响,假设样本设计和抽样过程的所有方面都是一样的,一个由150人组成的样本对一个由15,000或1,500万人组成的总体进行描述,可以得出同样有效的精确结论。与总的样本规模和其它设计特点相比(例如整群抽样),抽取的总体的分数对抽样误差的影响微不足道,在决定样本规模的时候,对其进行着重考虑是不必要的。
第二种不恰当的确定样本规模的做法比较容易理解一些。有些人受到了所谓的“标准调查研究”的影响,他们据此引申出了典型的或恰当的样本规模。于是,有的人会说全国性调查样本一般来说是1500人,或者说一个好的社区调查样本是500人。当然,参考有实力的调查者所认为的对特定总体来说最适宜的样本规模不失是一种聪明的做法。但是,像大多数其它的设计一样,样本规模的确定必须是建立在具体问题具体对待的基础上,要以研究者所要达到的各种研究目标以及对研究设计的许多其它方面的考虑为转移。
第三种,也是特别需要提到的一种确定样本规模的错误方法,因为它可以在很多统计学的教科书上找到。方法是这样的:研究者先确定能允许的误差极限或所要求的估计值的精确度,一旦明确了所要求的精确度,就可以简单地使用诸如表2.1或各种以上所提到的方法来计算能保证这个精确度的样本的规模。
从某种理论角度看,这种方法没有错误。但是,在实践中,它对打算进行真正研究的大多数研究者来说是没有什么帮助的。首先,通常不会仅仅根据估计值的精确度的需要来确定样本规模。大多数调查研究设计是要得出一些估计值,而这些估计值所需的精确度可能是不一样的。
另外,让研究者以相当概括的方式来指定所需的精确度是不常见的。除非是特例,一般情况下不能提前指定一个可接受的误差极限。即使在特例的情况下,所适用的方法也意味着抽样误差是调查评估中唯一的或主要的误差来源。当指定样本调查的精确度时,往往会忽略抽样之外的其它方面的误差来源。这种情况下,单以抽样误差为基础的精确度的计算是不现实的、过度简单化的。而且,在研究资源一定的情况下,减少用于回应率、问题设计或资料收集质量的资源去增加样本的规模,反而会降低精确度。
与样本规模有关的抽样误差的估计值在分析所需样本规模中的确扮演着一定的角色,但是,这个角色是很复杂的。
决定样本规模的首要条件是一个分析规划,这个分析规划的关键部分通常不是有关整体样本的置信区间的估计值,而是总体内结合部分总体的一些评估值形成的那些子群的大概情况。典型的情况是,设计过程很快就进行到在需要数据的总体中分出更小的组群,然后,研究者对所需样本规模进行估算以便确定一个小而充分的子群样本。大多数样本规模的确定并不关注对总体的估算,而是关注那些重要的最小子群能容许的最小样本规模。
再回到表2.1,不看样本规模的连续体的上限而是看其下限。50个研究对象够不够?如果有人研究表2.1,就可以发现在样本规模达到150到200之间时其精确度得到了稳定提高。过了这个点,增加样本规模所获得的效果就会小得多了。
像许多与研究设计有关的决策一样,很少有关于样本规模的研究。有许多方法可以增加调查估计值的信度,增加样本规模就是方法之一。纵然不能说只有唯一正确的答案,然而也能说出三种决定样本规模的不适宜的方法。指定一个总体的分数作为样本规模的方法决不是确定样本规模的恰当方法。抽样误差从根本上取决于样本规模,而不是取决于总体体现于样本中的比例。说一个特定的样本规模是研究一个总体的通常的或典型的方法,实际上也总是不正确的。致力于研究目标的分析规划才是关键性的第一步。最后,用所期望的某个总体变量的置信区间来确定样本规模的大小,是一种极为少用的方法。
作为总体调查误差一部分的抽样误差
抽样过程以三种不同的方式影响到调查估计值的质量:
-
如果样本框排除了一些要描述的人,那么样本估计值就会由于对这些本应包括在内的人的忽略程度的不同而有所偏误。
-
如果抽样过程不是概率性的,那么样本和被抽样的对象之间的关系就是有问题的。有人可能用其它理由而不是用抽样过程来证明样本的可信度,但是,除非抽样过程让每个人都有被抽取到的机会,否则没有任何统计数字能证明样本对被抽样的总体而言具有代表性。
-
概率样本的规模和设计,以及被评估内容的分布,共同决定了抽样误差的大小。也就是说,偶然变数的产生是由于收集的资料仅仅是关于一个样本的。
通常抽样误差被看作是调查估计值中不可靠性的的唯一来源。对于使用大样本的调查来说,产生误差的其它原因可能要更重要一些。本书的主要观点就是非抽样误差应该与抽样误差一样受到重视。当样本设计中包括了整群,或者根本没有形成概率样本时,采用简单随机抽样法也经常出现抽样误差。具有讽刺意味的是,用这些方法得出的抽样误差的估计值会误导读者对样本估计值准确度或精确度的判断。
如果一个详细的名单被用作样本框,或者采用一个简单的随机或系统抽样方案,或者所有的回应者都是以同样的机率选出来的,那么从一个样本中得出抽样和分析数据可能是十分简单的。就这样的设计而言,表2.1和其所依据的公式将会为抽样误差提供一个准确的估计值。但是,甚至用这样简单的设计,当评估调查估计值的精确度时,研究者仍然要考虑到所有的误差来源,包括样本框、无回应和回应误差(这些将在下一章讨论)。此外,当对最好的抽样方法有怀疑,或是采用简单随机抽样有偏差时,一位抽样专家的参与,对设计一个合理的抽样蓝图和正确地分析一个复杂的样本设计的后果都是极其必要的。
练习
为掌握抽样误差的含义,从同一名单(例如:电话薄)中重复抽取同样规模(不同随机起点)的样本。将有相同特点的(例如:买卖清单)样本按比例放在一起就会产生一个分布图,这个分布图将有一个大约是表2.1中已抽取样本规模数一半的标准离差。计算表2.1里的几个条目(例如,不同的样本规模和比例),对帮助人们了解这些数字的来源是十分有价值的。
文章来源: 转载自《调查研究方法》重庆大学出版社 2004年 10月版 作者: 弗洛德 J.福勒,Jr. 著 孙振东 龙 藜 陈 荟 译
(责任编辑:admin) |