ソフトウェアトリニティ使用プロセス
1.データのダウンロード
NCBIのSRAから元のオフマシンデータをダウンロードし、ペアエンドシーケンスのペアエンドを選択しますが、通常、フォーマット変換と解凍が必要なファイルは1つだけです。
2.ソフトウェアをインストールします
今回はすべてcondaを使用し、trinityおよびその他の付随するソフトウェアをcondaにインストールします。
conda install -c bioconda blast
conda install -c bioconda trinity
conda install samtools openssl=1.0
- samtoolsのインストールで問題が発生しました。解決策については、次のブログ投稿を参照してください。samtoolsのインストールは途中ではありませんが、途中で失敗します。
sratoolkitもインストールする必要がありますが、このソフトウェアはcondaにないため、直接wgetします。このリンクが失敗した場合は、他のリンクを見つけることができます。
wget https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.9.2/sratoolkit.2.9.2-centos_linux64.tar.gz
また、bowtie2をインストールする必要があるかもしれませんが、condaのインストールは失敗し、現在のpythonと互換性がありません。Wgetをお勧めします。
3.データ変換/解凍
tar -zxvf Trinity-v2.4.0.tar.gz
unzip download.1
fastq-dump -gzip -split-3 -A ERR2040864.1
[fastq-dumpはパッケージsratoolkitに依存します。-split-3-AはERR2040864.1を3つのファイルに分割でき、2つは両端で、残りの1つは両端の読み取りに起因しません]
4.トリニティを実行します
直接运行以下命令会出错:
nohup /home/chenss/anaconda3/envs/transcript/bin/Trinity --seqType fq --max_memory 1G --left ERR2040864.1_1.fastq --right ERR2040864.1_2.fastq --CPU 6 &
その理由は、トリニティは現在のJavaバージョンと互換性がないためです。正確には、プログラムのこの部分はJavaで記述されているため、バタフライは互換性がない3番目のステップです。
*** 解决办法1:***
nohup /home/chenss/anaconda3/envs/transcript/bin/Trinity --seqType fq --JM 5G --left ERR2040864.1_1.fastq --right ERR2040864.1_2.fastq --CPU 6 --no_run_butterfly --no_run_quantifygraph &
--no_run_butterfly --no_run_quantifygraphを追加します。最初の2つのステップを実行できます。インターネットでは、これらは別々に実行されると言われています。成功する可能性はありますが、すべての問題を解決できるわけではありません。
要約:トリニティは段階的な操作をサポートしていますが、段階的な操作の理由は途中のエラーを回避するためですが、トリニティは前の入力を自動的に検出するため、必要ではないと思います。エラーが発生した場合途中で、変更後、再度配信されます。元の出力は、前の結果を上書きせずに実行され続けます。
*** 解决办法2:***
トリニティ構成ファイルをjdk1.7と互換性があるように変更します。
構成ファイルの場所:/ home / chenss / anaconda3 / envs / transcript / bin / Trinity;実行する前にvi / javaを使用して検索して1.7に変更します。
nohup /home/chenss/anaconda3/envs/transcript/bin/Trinity --seqType fq --max_memory 1G --left ERR2040864.1_1.fastq --right ERR2040864.1_2.fastq --CPU 6 &
それは解決することができます。
PS:
1。/ home / chenss / anaconda3 / envs / transcript / bin / Trinityは、conda内のtrinityの保存場所を指します。
2.構成ファイルを変更する前– JM 5Gはエラーを報告しませんでした。変更後、エラーが報告されました。正常に実行するには、構成ファイルを削除して–max_memory1Gを追加する必要があります。新しいバージョンv2.4.0にはこれがないためです。パラメータの場合、–max_memoryに置き換えられます。
3.組み立て工程のクラゲのステップは、最もリソースを消費するステップであり、メモリは主にクラゲによって制御されます。
4.実行するperlまたはshスクリプトを作成するのが最善です
更新日:2020年11月24日09:31