BRAKER2ゲノムアノテーションを使用します

します。https://www.jianshu.com/p/e6a5e1f85dda

BRAKER2ゲノムアノテーションを使用します

BRAKER2ゲノムアノテーションは、GeneMark、AUGUSTUSおよびトランスクリプトームデータを組み合わせることができ、プロセスです。

ソフトウェアを使用する前に、ダウン注意すべき点がいくつかあります

  • 高品質のゲノムを提供するようにしてください。シーケンシングの3つの世代の価格が現在の下落で、それは問題ではありません。
  • ゲノム名前は簡単であるべき、最高の「> contig1」または「> tig000001」であります
  • ゲノムリピートはシールドする必要があります
  • デフォルトのパラメータは、通常、結果が良好である発揮するだけでなく、種に応じて
  • コメントの結果を確認してください、直接使用しないでください

ソフトウェアのインストール

(追加する必要がありブレーカー多くは、ソフトウェアに依存し、あなたはまた、我々はcondaでこれらの問題を解決することができ、多くのPerlモジュールをインストールする必要がありbiocondaチャンネル)

インストールが完了した後、出力は、いくつかのメッセージになり、次のようにまとめたものです

  • configディレクトリのAUGUSTUS保証が書き込み権限を持っている(彼らはこの問題を考慮していないcondaインストールを使用)
  • GeneMarkとGenomeThreaderはまた、追加のダウンロードをインストールする必要があります

私たちは、インストールする必要がありますから必要な、GeneMarkで  http://exon.gatech.edu/GeneMark/license_download.cgi  ダウンロードしてインストールした後、環境変数を追加

BRAKER2ソフトウェアは、condaがインストールされていないいくつかの提案もありますが、あなたは自分のオンデマンドをインストールする必要があります

  • DIAMOND 0.9.24:オルタナティブNCBI-BLAST +
  • cdbfasta 150:是正遺伝子はAUGUSTUS内終止コドンが含まれているオープンリーディングフレームを予測
  • 0.981をcdbyank:是正遺伝子はAUGUSTUS内終止コドンが含まれているオープンリーディングフレームを予測
  • GenomeThreader:あなたはタンパク質とのデータに注釈を付ける必要があるだけで、ニーズ

これらcondaインストールされていないソフトウェアのリファレンスについてhttps://github.com/Gaius-Augustus/BRAKER#optional-tools

cdbfastacdbyank

その後、環境変数に追加することができます

 

また、確立braker2環境condaにコピーすることができます~/miniconda3パスIのcondaがあります

 

インストールが完了したら、以下の提案は、このステップチェックソフトウェアに依存している実行

ソフトウェアの実行

ブレーカーは、データの種類に応じて、存在する異なる動作モードは、実際の状況に応じて、最も一般的なシナリオは、ゲノムの尺度であり、また、トランスクリプトームの第二世代を測定し、そしておそらく密接に関連する種のタンパク質配列の一部。だから、あなたが手に次のデータがあるとし

  • ゲノム配列:genome.fasta
  • トランスクリプトームデータ:XX_1.fq.gz、XX_2.fq.gz
  • タンパク質配列:proteins.fa

ステップ:ゲノムにこの基準ステップの反復配列をマスクRepeatMasker RepeatModelerと注釈付きゲノム反復配列を使用して

このステップgenome.fasta.masked出力は、入力されたコメントに従います

ステップ2:STAR命令が参照する、参照ゲノムにSTAR FASTQ比較を使用する「RNA-seqの解析ソフトウェア」RNA-seqのアラインメントツールSTARの研究ノート

測定結果が入力さ組み立て複数のxx.bamトランスクリプトームであれば、ファイルよりBAMを複数生成するために、各サンプルに対して一度実行。

ステップ3:実行BRAKER2

braker.plは48個のスレッドをサポートします。

最終的な出力は、タンパク質配列とCDS GFFファイルシーケンスとなります

発行することができます

あなたがcondaをインストールするときに問題が発生する可能性があります使用します

理由は、faToTwoBitプログラムエラー

condaが適切に依存関係を処理するために失敗したため、これがあり、高すぎるopensslのバージョン、次のように解決策があります

次の警告は、実行時に表示されます

オフ無視

参考資料

 

おすすめ

転載: www.cnblogs.com/zhanmaomao/p/11671000.html