6. 判别分析

一、判别分析的概念

判别分析概念:

判别分析(Discriminat Analysis)是多元分析中用于判别样本所属类型的一种统计分析方法。

判别分析方法:

是在已知的分类之下,对新的样本,可以利用此法选定一判别标准,以判定将该新样品放置于哪个类中。

判别分析的种类:

  1. 确定性判别:Fisher型判别
  2. 线性型
  3. 距离型
  4. 非线性型
  5. 概率性判别:Bayes型判别
  6. 概率型
  7. 损失型

二、线性判别分析

【例6.1】今天和昨天湿温差x1及气温差x2是预报明天下雨否的其中两个重要因子, 试建立Fisher线性判别函数

如测得今天 x1=8.1, x2=2.0 试报明天是雨天还是晴天?

2.1 基本统计分析

2.2 Logistic模型分析

2.3 Fisher判别分析

三、距离判别法

3.1 两总体距离判别

等方差阵: 直线判别

异方差阵: 曲线判别

【例6.2】对例6.1天气数据做距离判别分析

3.2 多总体距离判别

一、协方差矩阵相同:线性判别

二、协方差矩阵不同: 非线性判别

【例6.3】电视机品牌调查分析

1.线性判别(等方差)

  1. 二次判别(异方差)

四、Bayes判别法

4.1 Bayes判别准则

Fisher判别缺点:

  • 一是判别方法与各总体出现的概率无关
  • 二是判别方法与错判后造成的损失无关

Bayes判别准则:

  • 以个体归属于某类的概率(或判别值)最大
  • 或错判总平均损失最小为标准

一、概率判别

二、损失判别

4.2 正态总体的Bayes判别

二、协方差阵相等情形

三、后验概率的计算

对例6.3数据应用Bayes判别法进行判别

五、小结

  1. 判别分析方法是按已知所属组的样本确定判别函数,制定判别规则,然后再判断每一个新样品应属于哪一类。
  2. 常用的判别方法有Fisher判别、距离判别、贝叶斯判别等,每个方法根据其出发点不同各有其特点。
  3. Fisher类判别对判别变量的分布类型并无要求,而Bayes类判别要变量的分布类型。因此,Fisher类判别较Bayes类判别简单一些。
  4. 当两个总体时,若它们的协方差矩阵相同,则距离判别和Fisher判别等价。 当变量服从正态分布时,它们还和Bayes判别等价。
  5. 判别分析中的各种误判的后果允许看作是相同的,通常将犯第一类错误的 后果看得更严重些,但本章对此关注的不够。

参考资料

暨南大学 王斌会老师 《多元统计分析及R语言建模》课件

药企,独角兽,苏州。团队长期招人,感兴趣的都可以发邮件聊聊:tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn