【4.7.2】Cas-OFFinder预测gRNA的mismatch区域

Cas-OFFinder是基于OpenCL的超快速通用程序,可搜索CRISPR / Cas衍生的RNA引导的内切核酸酶(RGEN)的潜在脱靶位点。

Cas-OFFinder不受错配数目的限制,并允许Cas9(RGEN中的必需蛋白质成分)识别的原间隔物相邻基序(PAM)序列发生变化。

需要OpenCL设备才能正常运行。

  • Microsoft Windows (7 and 8) *GNU/Linux (CentOS, OpenSUSE, Debian, Ubuntu/Elementary OS)
  • Mac OS X (Mavericks)

一、安装

1.1 软件下载地址:

https://sourceforge.net/projects/cas-offinder/files/Binaries/2.4/Linux64/cas-offinder/download

1.2 下载数据库

hg19版本

cd /data/database/genome

wget http://hgdownload.soe.ucsc.edu/goldenPath/hg19/bigZips/chromFa.tar.gz
mkdir -p human_hg19

tar zxf chromFa.tar.gz -C ./human_hg19
$> ls -al /var/chromosome/human_hg19
    drwxrwxr-x.  2 user group      4096 2013-10-18 11:49 .
    drwxrwxr-x. 16 user group      4096 2013-11-12 12:44 ..
    -rw-rw-r--.  1 user group 254235640 2009-03-21 00:58 chr1.fa
    -rw-rw-r--.  1 user group 138245449 2009-03-21 01:00 chr10.fa
    -rw-rw-r--.  1 user group 137706654 2009-03-21 01:00 chr11.fa
    -rw-rw-r--.  1 user group 136528940 2009-03-21 01:01 chr12.fa
    -rw-rw-r--.  1 user group 117473283 2009-03-21 01:01 chr13.fa
    -rw-rw-r--.  1 user group 109496538 2009-03-21 01:01 chr14.fa

hg38,我用的这个版本

wget -c https://hgdownload.soe.ucsc.edu/goldenPath/hg38/bigZips/hg38.chromFa.tar.gz
mkdir -p human_hg38
tar zxf hg38.chromFa.tar.gz -C ./human_hg38

更多数据下载地址:https://hgdownload.soe.ucsc.edu/downloads.html#human

二、使用

[sam@g02 cas-offinder]$ ./cas-offinder –help

Cas-OFFinder v2.4 (Aug 17 2016)

Copyright (c) 2013 Jeongbin Park and Sangsu Bae
Website: http://github.com/snugel/cas-offinder

Usage: cas-offinder {input_file} {C|G|A}[device_id(s)] {output_file}
(C: using CPUs, G: using GPUs, A: using accelerators)

Example input file:

/var/chromosomes/human_hg19
NNNNNNNNNNNNNNNNNNNNNRG
GGCCGACCTGTCACTGACGCNNN 5
CGCCAGCGTCAGAGACAGGTNNN 5
ACGGCGCCAGCGACAGCGACNNN 5
GTCGCTGACGCTAGCGCCGTNNN 5

Available device list:
Type: GPU, ID: 0, <Tesla K80> on <NVIDIA CUDA>
Type: GPU, ID: 1, <Tesla K80> on <NVIDIA CUDA>
Type: GPU, ID: 2, <Tesla K80> on <NVIDIA CUDA>
Type: GPU, ID: 3, <Tesla K80> on <NVIDIA CUDA>
Type: GPU, ID: 4, <Tesla K80> on <NVIDIA CUDA>
Type: GPU, ID: 5, <Tesla K80> on <NVIDIA CUDA>
Type: GPU, ID: 6, <Tesla K80> on <NVIDIA CUDA>
Type: GPU, ID: 7, <Tesla K80> on <NVIDIA CUDA>

示例(使用GPU0和GPU1):

./cas-offinder input/input.txt G0,1 out.txt

input.txt中

  • 第一行是参考基因组的位置
  • 第二行是对匹配碱基进行限制,遵循如下的限制规则

  • 第三列是引物,以及容许mismatch的个数

两条引物耗时48s。out.txt输出结果示例:

GGCCGACCTGTCGCTGACGCNNN chr8    49679        GGgCatCCTGTCGCaGACaCAGG +       5
GGCCGACCTGTCGCTGACGCNNN chr8    517739       GcCCtgCaTGTgGCTGACGCAGG +       5
GGCCGACCTGTCGCTGACGCNNN chr8    599935       tGCCGtCtTcTCcCTGACGCCAG -       5
GGCCGACCTGTCGCTGACGCNNN chr8    5308348      GGCaGgCCTGgCttTGACGCAGG -       5
GGCCGACCTGTCGCTGACGCNNN chr8    9525579      GGCCcAgCTGTtGCTGAtGaAAG +       5
GGCCGACCTGTCGCTGACGCNNN chr8    12657177     GGCCcACCTGTgGCTGcCcaTAG -       5
GGCCGACCTGTCGCTGACGCNNN chr8    12808911     GGCCGACCaGgtGCTccCGCCGG +       5
GGCCGACCTGTCGCTGACGCNNN chr8    21351922     GGCCcACCTGaCtCTGAgGaCAG -       5
GGCCGACCTGTCGCTGACGCNNN chr8    21965064     GGCCGtCCTGcgGCTGctGCAGG -       5
GGCCGACCTGTCGCTGACGCNNN chr8    22409058     GcCCGACCccTCcCcGACGCCAG +       5

参考资料

个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn

Sam avatar
About Sam
专注生物信息 专注转化医学