Summarizing data

目前有一批数据,在用ggplot作图前,我需要先知道它的平均值和方差是多少,这个时候就需要对数据预先处理一下。

目前的策略有三种:

  1. ddply() 需要 plyr包
  2. summarizeBy() 需要doBy包
  3. aggregate() R内置的函数,但用起来麻烦

一、测试数据:

二、ddply

处理NA数据,因为lenght不具有na.rm选项

升级版的ddply

summarySE的使用

 

参考资料:
http://www.cookbook-r.com/Manipulating_data/Summarizing_data/

发表评论

电子邮件地址不会被公开。 必填项已用*标注