显著性检验[6]–卡方检验法 (chi-square test)

在各个研究领域中,有些研究问题只能划分为不同性质的类别,各类别没有量的联系。例如,性别分男女,职业分为公务员、教师、工人、……,教师职称又分为教授、副教授、……。有时虽有量的关系,因研究需要将其按一定的标准分为不同的类别,例如,学习成绩、能力水平、态度等都是连续数据,只是研究者依一定标准将其划分为优良中差,喜欢与不喜欢等少数几个等级。

对这些非连续等距性数据,要判别这些分类间的差异或者多个变量间的相关性方法称为计数数据统计方法。 继续阅读“显著性检验[6]–卡方检验法 (chi-square test)”

sklearn[e3 ??]:混合多重方法获得feature

Concatenating multiple feature extraction methods
通常有很多方法从数据集中获得features,有时候需要把多重方法混合在一起,才能得到一个更好的结果。
这里讲介绍的是通过FeatureUnion将PCA和univariate selection两种方法获得features混合起来用。

继续阅读“sklearn[e3 ??]:混合多重方法获得feature”