パラメータなしのトリニティトランスクリプトームアセンブリ

ソフトウェアトリニティ使用プロセス

1.データのダウンロード

NCBIのSRAから元のオフマシンデータをダウンロードし、ペアエンドシーケンスのペアエンドを選択しますが、通常、フォーマット変換と解凍が必要なファイルは1つだけです。

2.ソフトウェアをインストールします

今回はすべてcondaを使用し、trinityおよびその他の付随するソフトウェアをcondaにインストールします。

	conda install -c bioconda blast
	conda install -c bioconda trinity
	conda install samtools openssl=1.0

sratoolkitもインストールする必要がありますが、このソフトウェアはcondaにないため、直接wgetします。このリンクが失敗した場合は、他のリンクを見つけることができます。

wget  https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.9.2/sratoolkit.2.9.2-centos_linux64.tar.gz

また、bowtie2をインストールする必要があるかもしれませんが、condaのインストールは失敗し、現在のpythonと互換性がありません。Wgetをお勧めします。

3.データ変換/解凍

tar -zxvf Trinity-v2.4.0.tar.gz
unzip download.1
fastq-dump -gzip -split-3 -A ERR2040864.1 

[fastq-dumpはパッケージsratoolkitに依存します。-split-3-AはERR2040864.1を3つのファイルに分割でき、2つは両端で、残りの1つは両端の読み取りに起因しません]

4.トリニティを実行します

直接运行以下命令会出错:
nohup /home/chenss/anaconda3/envs/transcript/bin/Trinity --seqType fq --max_memory 1G --left ERR2040864.1_1.fastq --right ERR2040864.1_2.fastq --CPU 6 &

その理由は、トリニティは現在のJavaバージョンと互換性がないためです。正確には、プログラムのこの部分はJavaで記述されているため、バタフライは互換性がない3番目のステップです。

*** 解决办法1:***

nohup /home/chenss/anaconda3/envs/transcript/bin/Trinity --seqType fq --JM 5G --left ERR2040864.1_1.fastq --right ERR2040864.1_2.fastq --CPU 6 --no_run_butterfly --no_run_quantifygraph &

--no_run_butterfly --no_run_quantifygraphを追加します。最初の2つのステップを実行できます。インターネットでは、これらは別々に実行されると言われています。成功する可能性はありますが、すべての問題を解決できるわけではありません。
要約:トリニティは段階的な操作をサポートしていますが、段階的な操作の理由は途中のエラーを回避するためですが、トリニティは前の入力を自動的に検出するため、必要ではないと思います。エラーが発生した場合途中で、変更後、再度配信されます。元の出力は、前の結果を上書きせずに実行され続けます。

*** 解决办法2:***

トリニティ構成ファイルをjdk1.7と互換性があるように変更します。
構成ファイルの場所:/ home / chenss / anaconda3 / envs / transcript / bin / Trinity;実行する前にvi / javaを使用して検索して1.7に変更します。

nohup /home/chenss/anaconda3/envs/transcript/bin/Trinity --seqType fq --max_memory 1G --left ERR2040864.1_1.fastq --right ERR2040864.1_2.fastq --CPU 6 &

それは解決することができます。


PS
1。/ home / chenss / anaconda3 / envs / transcript / bin / Trinityは、conda内のtrinityの保存場所を指します。
2.構成ファイルを変更する前– JM 5Gはエラーを報告しませんでした。変更後、エラーが報告されました。正常に実行するには、構成ファイルを削除して–max_memory1Gを追加する必要があります。新しいバージョンv2.4.0にはこれがないためです。パラメータの場合、–max_memoryに置き換えられます。
3.組み立て工程のクラゲのステップは、最もリソースを消費するステップであり、メモリは主にクラゲによって制御されます。
4.実行するperlまたはshスクリプトを作成するのが最善です

更新日:2020年11月24日09:31

おすすめ

転載: blog.csdn.net/mushroom234/article/details/110039356