【5.4.1】Nanopore_psU

一、安装

git clone https://github.com/sihaohuanguc/Nanopore_psU.git  
pip install .
nanopsu -h

二、使用

1.先使用guppy来call, 生成fastq文件

guppy_basecaller --input_path fast5 \
				 --recursive \
				 --save_path fastq \
				 --records_per_fastq 0 \
				 --flowcell FLO-MIN106 \
				 --kit SQK-RNA002 \
				 --qscore_filtering \
				 --min_qscore 7 \
				 --cpu_threads_per_caller 3 \
				 --num_callers 5

2.Alignment and pile up

nanopsu alignment -i path/of/fastq/ -r reference.fa

生成的文件

$ ls alignment/plus_strand/
collect.bam    collect_pile.txt  collect.sorted.bam  reference.fa.fai
collect.fastq  collect.sam       reference.fa

3.特征提取

删掉未匹配的位点,用>符号表示的

nanopsu remove_intron

某个位置的U,至少有20个reads覆盖,才进一步的提取

nanopsu extract_features

4.psU预测

nanopsu prediction

三、文献解读

纳米孔数据预处理

  1. 在测序过程中生成的所有原始 fast5 文件,由 guppy 碱基调用程序(版本 3.2.2+9fe0a78)使用 min_qscore 7 调用的碱基。
  2. 由 minimap2(版本 2.18-r1015)[ 37 ] 与参数 -ax splice -uf -k14 对齐。 (这样的比对,的确会得到更多的序列)
  3. “错误”特征是通过定制的 Python 脚本( https://github.com/sihaohuanguc/Nanopore_psU )从 mpileup 文件中提取的。

四、报错

参考资料

药企,独角兽,苏州。团队长期招人,感兴趣的都可以发邮件聊聊:tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn