factor、levels、reorder

变量可归结为类别(名义型),有序型,连续型变量(区间变量)。类别变量和有序类别(有序型)变量在R中称为因子(factor)。区间变量取连续的数值,可以进行求和、平均等运算。名义变量和有序变量取离散值,可以用数值代表也可以是字符型值,其具体数值没有加减乘除的意义,不能用来计算而只能用来分类或者计数。名义变量比如性别、省份、职业,有序变量比如班级名次。函数factor()以一个整数向量的形式存储类别值,整数的取值范围是[1……k](其中k是名义型变量中唯一值的个数),同时一个字符串(原始值)组成的内内部向量将映射到这些整数上。

继续阅读“factor、levels、reorder”

apply、tapply、lapply、sapply、mapply、table等函数进行分组统计

对矩阵一般的分组统计方式不能满足的时候,我们就需要借助一些函数来帮忙,这里讲介绍apply、tapply、lapply、sapply、mapply、table等函数进行分组统计。

继续阅读“apply、tapply、lapply、sapply、mapply、table等函数进行分组统计”