wordcloud–标签云制作

标签云是文字的视觉化描述。通常以字号和颜色来映射文字的相关属性。比如把词频映射到字号,把词性映射到颜色等。要想制作具有视觉冲击的标签云,要把重点放在字体和颜色的选择上。已经有很多工具可以制作标签云,最有名的莫过于wordpress,遗憾的是wordpress不支持中文的标签云制作,本文主要通过两个实例演示基于wordcloud的标签云制作。

Read More …

图形布局–par()详解

R有着非常强大的绘图功能,我们可以利用简单的几行代码绘制出各种图形来,但是有时候默认的图形设置没法满足我们的需要,甚至会碰到各种各样的小问题:如坐标轴或者标题出界了,或者图例说明的大小或者位置遮挡住了图形,甚至有时候默认的颜色也不能满足我们的需求。如何进行调整呢?这就用到了“强大”的函数par()。我们可以通过设定函数par()的各个参数来调整我们的图形,这篇博文就是对函数par()的各个参数进行一下总结。

Read More …

入职体检报告初步解读

对于即将毕业工作的学生,少不了的是入职体检。上午去9点半之前去体检,下午5点拿报告。拿到报告我就懵了,有两项需要复查,回头问医生,医生给的解释:这些可以忽略不计,但我还是得写上。然后他就不说话了。花了170RMB,感觉啥都摸不着头脑。在网上一搜入职体检报告解读方面的资料,发现网络上被各种广告充斥着。本着对健康负责的态度,回来查资料自己科普一下。

Read More …

bowtie2

一、转录组还是基因组?

map常用的工具有bowtie/bowtie2, BWA,SOAP1/SOAP2等。这个问题又会被分成两个问题,是基因组测序(DNA-seq)还是转录组测序(mRNA-seq)。其中的区别是对于真核生物而言,mRNA序列与DNA序列并不完全相同,在经历了后剪切之后,成熟的mRNA可能是原基因的一部分,甚至顺序及个别碱基会产生变化。如果是mRNA测序,那map工作就会在DNA测序map的基础上再多一步,map到转录组上去。所以最为流行的做法是,使用bowtie来map DNA测序,使用tophat来map RNA测序。实际上,tophat是通过调用bowtie来完成工作的。而tophat1和tophat2的差别最主要的就是调用了bowtie1还是bowtie2。当然如果你只安装了bowtie1的话,tophat2也可以调用它

Read More …

interproscan安装及使用

Interpro是一个数据库,它里面有蛋白功能,蛋白家族等信息。而Interproscan就是可以将你的蛋白序列跟这个这个数据比对,从而给你的序列功能注释。
Interproscan5新增了一些功能
Phobius用来预测跨膜和信号肽
可以把结果map到上传的数据上
寻找蛋白可能的生物学代谢途径
新的输出格式XML和GFF3.0
提升了图形界面的

Read More …