【6.7.2】Cas-OFFinder预测gRNA的mismatch区域
Cas-OFFinder是基于OpenCL的超快速通用程序,可搜索CRISPR / Cas衍生的RNA引导的内切核酸酶(RGEN)的潜在脱靶位点。
Cas-OFFinder不受错配数目的限制,并允许Cas9(RGEN中的必需蛋白质成分)识别的原间隔物相邻基序(PAM)序列发生变化。
需要OpenCL设备才能正常运行。
- Microsoft Windows (7 and 8) *GNU/Linux (CentOS, OpenSUSE, Debian, Ubuntu/Elementary OS)
- Mac OS X (Mavericks)
一、安装
1.1 软件下载地址:
https://sourceforge.net/projects/cas-offinder/files/Binaries/2.4/Linux64/cas-offinder/download
1.2 下载数据库
hg19版本
cd /data/database/genome
wget http://hgdownload.soe.ucsc.edu/goldenPath/hg19/bigZips/chromFa.tar.gz
mkdir -p human_hg19
tar zxf chromFa.tar.gz -C ./human_hg19
$> ls -al /var/chromosome/human_hg19
drwxrwxr-x. 2 user group 4096 2013-10-18 11:49 .
drwxrwxr-x. 16 user group 4096 2013-11-12 12:44 ..
-rw-rw-r--. 1 user group 254235640 2009-03-21 00:58 chr1.fa
-rw-rw-r--. 1 user group 138245449 2009-03-21 01:00 chr10.fa
-rw-rw-r--. 1 user group 137706654 2009-03-21 01:00 chr11.fa
-rw-rw-r--. 1 user group 136528940 2009-03-21 01:01 chr12.fa
-rw-rw-r--. 1 user group 117473283 2009-03-21 01:01 chr13.fa
-rw-rw-r--. 1 user group 109496538 2009-03-21 01:01 chr14.fa
hg38,我用的这个版本
wget -c https://hgdownload.soe.ucsc.edu/goldenPath/hg38/bigZips/hg38.chromFa.tar.gz
mkdir -p human_hg38
tar zxf hg38.chromFa.tar.gz -C ./human_hg38
更多数据下载地址:https://hgdownload.soe.ucsc.edu/downloads.html#human
二、使用
[sam@g02 cas-offinder]$ ./cas-offinder –help
Cas-OFFinder v2.4 (Aug 17 2016)
Copyright (c) 2013 Jeongbin Park and Sangsu Bae
Website: http://github.com/snugel/cas-offinder
Usage: cas-offinder {input_file} {C|G|A}[device_id(s)] {output_file}
(C: using CPUs, G: using GPUs, A: using accelerators)
Example input file:
/var/chromosomes/human_hg19
NNNNNNNNNNNNNNNNNNNNNRG
GGCCGACCTGTCACTGACGCNNN 5
CGCCAGCGTCAGAGACAGGTNNN 5
ACGGCGCCAGCGACAGCGACNNN 5
GTCGCTGACGCTAGCGCCGTNNN 5
Available device list:
Type: GPU, ID: 0, <Tesla K80> on <NVIDIA CUDA>
Type: GPU, ID: 1, <Tesla K80> on <NVIDIA CUDA>
Type: GPU, ID: 2, <Tesla K80> on <NVIDIA CUDA>
Type: GPU, ID: 3, <Tesla K80> on <NVIDIA CUDA>
Type: GPU, ID: 4, <Tesla K80> on <NVIDIA CUDA>
Type: GPU, ID: 5, <Tesla K80> on <NVIDIA CUDA>
Type: GPU, ID: 6, <Tesla K80> on <NVIDIA CUDA>
Type: GPU, ID: 7, <Tesla K80> on <NVIDIA CUDA>
示例(使用GPU0和GPU1):
./cas-offinder input/input.txt G0,1 out.txt
input.txt中
- 第一行是参考基因组的位置
- 第二行是对匹配碱基进行限制,遵循如下的限制规则
- 第三列是引物,以及容许mismatch的个数
两条引物耗时48s。out.txt输出结果示例:
GGCCGACCTGTCGCTGACGCNNN chr8 49679 GGgCatCCTGTCGCaGACaCAGG + 5
GGCCGACCTGTCGCTGACGCNNN chr8 517739 GcCCtgCaTGTgGCTGACGCAGG + 5
GGCCGACCTGTCGCTGACGCNNN chr8 599935 tGCCGtCtTcTCcCTGACGCCAG - 5
GGCCGACCTGTCGCTGACGCNNN chr8 5308348 GGCaGgCCTGgCttTGACGCAGG - 5
GGCCGACCTGTCGCTGACGCNNN chr8 9525579 GGCCcAgCTGTtGCTGAtGaAAG + 5
GGCCGACCTGTCGCTGACGCNNN chr8 12657177 GGCCcACCTGTgGCTGcCcaTAG - 5
GGCCGACCTGTCGCTGACGCNNN chr8 12808911 GGCCGACCaGgtGCTccCGCCGG + 5
GGCCGACCTGTCGCTGACGCNNN chr8 21351922 GGCCcACCTGaCtCTGAgGaCAG - 5
GGCCGACCTGTCGCTGACGCNNN chr8 21965064 GGCCGtCCTGcgGCTGctGCAGG - 5
GGCCGACCTGTCGCTGACGCNNN chr8 22409058 GcCCGACCccTCcCcGACGCCAG + 5
参考资料
这里是一个广告位,,感兴趣的都可以发邮件聊聊:tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn