Trinity转录组无参组装

软件trinity使用流程

1. 数据下载

从NCBI的SRA下载原始下机数据,选择双端测序的Pair-end,但是一般只有一个文件,需要进行格式转换与解压:

2. 安装软件

本次全部使用conda进行,在conda中安装trinity和其他附带软件:

	conda install -c bioconda blast
	conda install -c bioconda trinity
	conda install samtools openssl=1.0

还需要安装sratoolkit,但是conda中没有找到这个软件,所以直接wget了,如果此链接失效可以寻找其他链接:

wget  https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.9.2/sratoolkit.2.9.2-centos_linux64.tar.gz

可能还需要安装bowtie2,但是conda安装失败,不兼容目前python,建议wget

3. 数据转换/解压

tar -zxvf Trinity-v2.4.0.tar.gz
unzip download.1
fastq-dump -gzip -split-3 -A ERR2040864.1 

[fastq-dump依赖包sratoolkit;-split-3-A 能够将ERR2040864.1分为3个文件,双端2个,剩下的1个存放不能归于双端的reads]

4. 运行trinity

直接运行以下命令会出错:
nohup /home/chenss/anaconda3/envs/transcript/bin/Trinity --seqType fq --max_memory 1G --left ERR2040864.1_1.fastq --right ERR2040864.1_2.fastq --CPU 6 &

原因是trinity不兼容目前的java版本,确切来说是第三步butterfly不兼容,因为这部分程序是用java编写的。

*** 解决办法1:***

nohup /home/chenss/anaconda3/envs/transcript/bin/Trinity --seqType fq --JM 5G --left ERR2040864.1_1.fastq --right ERR2040864.1_2.fastq --CPU 6 --no_run_butterfly --no_run_quantifygraph &

添加–no_run_butterfly --no_run_quantifygraph ;可以运行前两步,网上说是分开运行,的确可以成功,但解决不了全部问题。
摘:trinity支持分步骤运行,但我认为必要性不大,因为分步运行的原因在于避免中途发生错误,但是trinity会自动检测之前输入,如果中途发生报错,进行修改之后,再次投递,会按照原输出继续跑,不会对之前结果进行覆盖

*** 解决办法2:***

修改trinity配置文件,使它能够兼容jdk1.7:
配置文件位置:/home/chenss/anaconda3/envs/transcript/bin/Trinity ;使用vi /java查找并修改成1.7再运行

nohup /home/chenss/anaconda3/envs/transcript/bin/Trinity --seqType fq --max_memory 1G --left ERR2040864.1_1.fastq --right ERR2040864.1_2.fastq --CPU 6 &

即可解决。


PS
1. /home/chenss/anaconda3/envs/transcript/bin/Trinity 是指conda中trinity存放位置。
2. 修改配置文件之前–JM 5G没报错,修改后报错了,只能删除,又加入–max_memory 1G才能运行成功,因为新版本v2.4.0没有这一参数,由–max_memory代替。
3. 组装过程中jellyfish这一步是最耗费资源的一步,内存主要由jellyfish控制。
4. 最好写一个perl或者sh脚本运行

更新于:2020年11月24日09点31分

猜你喜欢

转载自blog.csdn.net/mushroom234/article/details/110039356
今日推荐