【1.2.3】统计调查的组织方式(抽样)

一、统计报表制度

统计报表(statistical report forms)制度是指依照国家统计局或国家各行政管理部门的规 定,自上而下地统一布置,以一定的原始记录为依据,按照统一的表式,统一的指标项目, 统一的报送时间与报送程序,自下而上地逐级定期提供基本统计资料的一种调查方式。不同 的部门统计报表的内容会有所不同,但一般都包括 8 张报表。如工业统计报表包括年报表 3 张:《工业产品生产、销售总值》、《工业企业财务状况》和《工业企业能源购进、消费及库 存》;月报表 3 张:《工业产销总值及主要产品产量》、《工业企业主要经济指标》和《大中型 工业企业总产值调查表》和季报表 2 张:《主要工业产品销售与库存量》和《工业企业主要 能源消费量与库存量》。

二、普查

普查(census)是对调查对象的全部调查单位逐一进行的调查。其特点:是一次性调查, 是专门组织的全面调查,即主要用来调查一定时点上的现象总量。普查是全面、系统地掌握 国情国力等重要统计数据的主要方法之一。由于普查涉及面广、耗费人财物多、组织工作繁 重,因此只能按一定周期进行。普查的具体方式主要通过专门组织的普查机构自上而下的对 被调查单位直接进行登记。

各个国家对普查都给予的充分的重视,甚至把普查看作是仅次于战争的“运动”。西方国 家几乎没有统计报表制度,所以全面资料是依靠普查获得的。美国有专门的普查局负责各类 普查,并有专门网页提供相关信息与资料。点击下面的链接,在右上方有“Population Clock”, 敲敲看。

美国普查局 http://www.census.gov/

根据国务院的决定,我国 2008 年进行第二次全国经济普查,标准时点为 2008 年 12 月 31 日。国家统计局普查中心建立了专门的网页,介绍普查机构和普查方案,并有成果发布 和资料开发等专栏。

中国经济普查网 http://www.stats.gov.cn/zgjjpc/jjpc2/

三、抽样调查

抽样调查(sampling survey)是一种非全面调查,它是在全部调查单位中抽取一部分单 位作为样本进行调查,再根据调查结果反映总体状态的一种调查方法。广义的抽样调查包括 随机抽样与非随机抽样。 非随机抽样是调查者根据自己的主观愿望选取样本的方法,也可称为非概率抽样或不等 概率抽样,如下面提到的重点调查和典型调查。非随机抽样的目的是要通过了解一部分个体 的情况而获取总体的信息。但由于非随机抽样无法计算误差,所以也就无法作统计推断。 非随机抽样依抽样特点可分为方便抽样、定额抽样、判断抽样、滚雪球抽样和空间抽样。

学生:我来想象一下,方便抽样就是“街头拦人”偶遇抽样;定额抽样是先分群,然后 成比例地主观抽取样本;判断抽样是选择那些认为最能代表总体的单位作为样本。后两个……

教师:滚雪球抽样是首先选取一部分具有所需特征的人作为调查对象,然后依据他 们提供的满足调查要求的名单作为第二批调查对象,再由这些人提供第三批调查对 象,……依次类推,样本象滚雪球一样由小变大,在个体的信息不足时使用这种方 式。 空间抽样是对运动着的、暂时性的空间群体的抽样。如,游行与集会,参加者 从一地到另一地,一些人离去又有一些人加入,这些事件是在一定范围内进行的。 空间抽样作法是:多个调查员间隔均匀的距离,从某一方向开始,访问最靠近他的 人,然后每隔一定步数抽取一人进行调查。

我们一般提到的“抽样调查”主要是指随机抽样,其基本特征:一是样本单位是按随机原 则抽取,这就排除了主观因素对选择的影响;二是对所抽得的样本进行调查,取得数据,并 据此推断总体特征。

抽样调查的组织方式主要有以下五种:

3.1 简单随机抽样(simple random sampling)

,又叫纯随机抽样,是最简单、最普遍的 抽样组织方法。它是按照随机性原则直接从总体的所有单位中,抽取若干个单位作为样本, 保证总体中每个单位在抽选中都有同等被抽中的机会。随机抽选样本单位的具体做法有:抽 签法、随机数字表法(见附录一)和用计算机软件中的随机函数产生随机数。

Excel 提供了帮助我们进行简单随机抽样的工具。

【例 2.1】根据数据集 03 中的 470 人名单,如何抽取一个样本容量为 10 的随机样本? (SPSS 数据文件编号:data2_01)

【解–excel解决方案】

  1. 将数据集 03 中的序号摘出,要求在这 470 个人员中随机抽取 10 人
  2. 选择菜单“工具”—“数据分析”,打开“数据分析”对话框
  3. 选择其中的“抽样”,打开对话框,见图 1.1
  4. 正确填写相关信息后,点“确定”,结果将显示在 C 列中,见图 1.2, 图中 E 列是又一次运行的结果

3.2 分层抽样(stratifiedsampling)

,又叫类型抽样,它是先将总体各单位按某一有关标 志分成若干个类型组,然后按照一定比例再从各类型组中随机抽取样本单位。在抽样调查实 践中,往往在设计抽样方案之前,我们对所要研究的总体构成已经有了一些了解。如已知调 查单位分属于不同类型的子总体或已知与调查项目相关的一些信息,此时,我们可以而且应 该利用这种事先获得的信息,采用分层抽样进行取样,以提高抽样推断的精度。如在职工家 庭生活调查中,可先将全部职工按部门分为工业、商业、文教、卫生等部门,然后再从这些 部门中按一定比例抽选调查单位。采用这种抽样方法可以提高样本的代表性,减少抽样误差。 对于那些总体情况复杂、各单位之间差异较大、单位数量较多的抽样调查问题,一般都可以 采用分层抽样的方法进行抽样调查。

3.3 系统抽样(systematic sampling)

,又叫等距抽样或机械抽样。它是先把总体所有单 位按某一标志排队,并根据总体单位数 N 与样本容量 n 的比例计算出抽样间隔,随机确定 一个起始点作为第一个调查单位,以后每隔相等的间隔抽取下一个调查单位。

在排队时所采用的标志,可以是与调查项目有关的,也可以是与调查项目无关的,前者 称为有关标志排队法;后者称为无关标志排队法。例如,对某校学生学习情况进行调查,如 按姓氏笔画就是无关标志排队;如按入学考试分数排队就是有关标志排队。显然按有关标志 排队进行抽样所得到的样本的代表性好于按无关标志排队的样本,其相应的抽样误差也会比 较小。

在实际进行抽样时必须注意到,系统抽样在排定顺序,且第一个样本单位的位置确定后, 其余单位的位置也就随之确定。因此,要避免抽样间隔和现象本身的周期性节奏相重合引起 系统性的影响,如工业产品质量抽查,产品抽查时间间隔不宜和上下班时间一致,防止发生 系统性偏差。

3.4. 整群抽样(clustersampling)

,将总体所有单位划分为若干个群,然后以群为单位从 中随机抽取部分群,对抽中的群内所有单位进行全面调查的抽样组织形式。如调查某县小学 教育情况,我们可以从该县中随机抽取若干个小学,然后对抽中的小学进行全面调查。整群 抽样与前面三种抽样组织方法相比,是抽样单位扩大了,即抽取的基本单位不再是个体而是 群。用该种方法可以有效地降低抽样的组织成本。

3.5. 多阶段抽样(multiplestagesampling)

,是将总体分成若干小的群体,但并不在每一 小的群体中抽取一个样本,而是将这些小群体称为第一阶抽样单元,将它们看作个体进行抽 样,然后,再对抽中的第一阶抽样单元中的个体抽样,这样的抽样当然可以不止二阶而是多 阶的,先抽第一阶抽样单元,再在第一阶抽样单元钟抽第二阶抽样单元,再在第二阶抽样单 元中抽第三阶抽样单元,如此直至最基层的个体。当总体中个体数量太大,或其他技术上的 原因,无法直接对个体编号时,可以采用多阶抽样,先按第一阶单元编号,抽取若干个,再 在抽得的第一阶单元内编号,抽取下一级单元。多阶抽样会使现场观测的样本单元比较集中, 有利于节省调查费用。

抽样调查是世界上许多国家收集资料的重要方法。随着改革的不断深化,我国官方统计 对调查方法进行了一系列的改革,要求各统计主体在各领域广泛采用抽样调查方法以逐步取 代传统的统计报表,以确立它在统计调查方法体系中的主体地位。有关抽样调查的理论和方 法将在本书第五章作详细介绍。

3.6

另外,抽样时会用不同的方式:重复抽样和不重复抽样。

  1. 重复抽样(samplingwithreplication)每次从总体中抽取一个样品单位,检验后重新 放回总体,参加下次抽样。

  2. 不重复抽样(samplingwithoutrepeating)每次从总体中抽取的一个样品单位,检验 后不再放回总体,这样下次抽样时不会再次抽到已抽中过的样品单位,因此每个样品单位在各次抽样中被抽中的概率是不同的。

如果我们从总体 N=1000 中抽取样本 n=30,实际的做法往往是,直接从 1000 中一次性随 机抽取 100 个,这就是用了不重复抽样。一个样品单位至多只能被抽中一次,因而其代表性 要好于重复抽样,故我们在第五章讲到抽样误差时,用不重复抽样的要小于重复抽样的;讲 到必要的样本容量时,用不重复抽样的要少于重复抽样的。

四、重点调查

重点调查(key-point survey)是指在调查对象中,选择一部分重点调查单位收集统计资 料的一种非全面调查。所谓重点调查单位,是指这些被调查的总体单位数目不多,所占比重 不大,但其调查的标志值却在总量中占有很大比重,在总体中具有举足轻重的作用。通过对 这部分重点单位的调查,可以从数量上说明总体在该标志总量方面的基本情况。当调查任务 只要求掌握基本情况,而部分单位又能比较集中地反映所要研究的问题时,采用重点调查较 为适宜。比如,对钢铁行业的调查,由于大型的钢铁企业为数不多,但产出量却很大,因此 可以通过对少数企业的调查,而掌握整个行业大致情况。

五、典型调查

典型调查(model survey)是指根据调查目的,在对所研究现象全面分析的基础上,有 意识地选择有代表性的典型单位进行深入细致地调查,以便认识事物的本质与发展变化规律 的一种非全面调查方法。所谓典型单位,是指那些能充分、集中地体现调查对象总体某些方 面共性特征的最有代表性的单位。

典型调查方式有两种:一是“解剖麻雀”式调查,它在调查对象总体单位之间的差异较小 时适用。这时,只选择个别典型单位进行深入细致的调查,以便通过对典型单位特征的认识 来找出同类事物的一般情况及其发展变化规律。二是“划类选典”式的调查,它在调查对象总 体各单位之间的差异较大时适用。这时,先对调查对象总体进行分类,然后从各类中选择少 数具有代表性的典型单位进行深入细致地调查,以便找出事物的发展化规律并以此对调查对 象总体进行推断估计。

各种统计资料收集的组织方式,我们可以根据自己的统计任务与要求灵活选用。

参考资料

  • 《统计学》 南京财经大学 陈耀辉、王芳、王庚、韩中、张艳芳、黄莉芳
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn

Sam avatar
About Sam
专注生物信息 专注转化医学