异常值(离异值)检测

在处理实验数据的时候,我们常常会遇到个别数据值偏离预期或大量统计数据值结果的情况,如果我们把这些数据值和正常数据值放在一起进行统计,可能会影响实验结果的正确性,如果把这些数据值简单地剔除,又可能忽略了重要的实验信息。这里重要的问题是如何判断异常值,然后将其剔除。判断和剔除异常值是数据处理中的一项重要任务,目前的一些方法还不是十分完善,有待进一步研究和探索。
Read More …

变量(3)–离散随机变量与分布

定义:

若随机变量X只取有限多个可列无限多个值,则称X为离散型随机变量。比如投一个色子出现的点数X,取值范围是{1,2,3,4,5,6};110报警台一天接到的报警次数Y,取值范围为{0,1,2……}

设X为离散型随机变量,它的一切可能取值为X1,X2,……,Xn,……,

p(xn)=P{X=xn,n=1,2

这个函数为随即变量X的概率函数,又称为X的概率分布,简称分布

Read More …

显著性检验

显著性检验(significance test)就是事先对总体(随机变量)的参数或总体分布形式做出一个假设,然后利用样本信息来判断这个假设(原假设)是否合理,即判断总体的真实情况与原假设是否有显著性差异。或者说,显著性检验要判断样本与我们对总体所做的假设之间的差异是纯属机会变异,还是由我们所做的假设与总体真实情况之间不一致所引起的。显著性检验是针对我们对总体所做的假设做检验,其原理就是“小概率事件实际不可能性原理”来接受或否定假设。

Read More …