【1.2.1】数据的来源

按照获取途径不同,数据可分为

  • 原始数据
  • 次级数据资料

原始数据也称为第一手资料 (primary source),是反映被调查对象原始状况的资料。如原始记录、统计台帐、调查问卷 答案、实验结果等。次级数据也称为第二手资料(secondary source),是已经存在的经他人 整理分析过的资料。如期刊、报纸、广播、电视以及因特网上的资料,各级政府机构公布的 资料,企业内部记录和报告等。一般在可能的情况下尽量使用第一手资料,它比第二手资料 更加丰富、更加准确。第二手资料的收集成本相对比较低。

数据集 01 的数据来自《中国统计年鉴》,数据集 02 是世界银行根据各国国家所报送的 资料整理的,它们是次级数据;数据集 03 是直接对公司职工情况的记录;数据集 04 是直接 从流水线上采集的,它们 是原始数据。

一般而言,统计调查是获取数据的主要形式,收集到的主要是第一手资料;查阅文献、 年鉴,上因特网等是获取统计资料的辅助形式,收集到的主要是第二手资料。

在信息化时代,数据成为海洋。如何在数据海洋中汲取丰富的营养而不被大海的波涛吞 没?首先应该对自己的事业投入更多的精力,对它有更清晰的理解;其次是掌握信息渠道, 即知道自己所需要的数据如何获得;再者就是对获得的数据进行深度加工,使之成为决策依 据。

数据集 02 是 1995 年的资料,十多年过去了,现在的情况怎么样了?你知道如何去收集 现在的资料吗?

网络链接: 世界银行的数据库 http://databank.worldbank.org/ddp/home.do

除了著名的国际组织、各国的官方统计机构免费提供宏观数据外,许多行业组织和咨询 机构也以免费或收费的方式提供行业数据库和企业数据库以支持企业决策。

网络链接: 数据中华 http://www.allchinadata.com

参考资料

  • 《统计学》 南京财经大学 陈耀辉、王芳、王庚、韩中、张艳芳、黄莉芳
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn

Sam avatar
About Sam
专注生物信息 专注转化医学