トランスクリプトーム学習用ソフトウェア samtools [学習ノートわかりやすい版]

トランスクリプトーム学習用ソフトウェア samtools [学習ノートわかりやすい版]

日付:2023.07.25

レコーダー:CYH-BI

特記事項(宣言):この記事は私自身の勉強記録であり、何の権威も持たず、初心者向けのアイデアや参考程度にとどめてください。
この記事のアドレスは次のとおりです。


サムツールの紹介

Samtools は、SAM/BAM (スペース圧縮に使用される SAM のバイナリ形式) 形式のアライメント ファイルを処理するためのツールであり、SAM (シーケンス アライメント/マップ: シーケンス アライメント) 形式のファイルを入出力でき、ソート、マージ、およびインデックス作成。ソートされた.bam は、その後の転写産物のアセンブリと定量化に使用されます。

samtools ツールをインストールする

方法 1: 公式 Web サイトからのダウンロード パッケージのインストール (非推奨)

インストールする前に、必要な依存環境をインストールする必要があります。そうしないと、samtoolsのインストール後に機能しません。

#安装依赖
yum install bzip2-devel ncurses-libs ncurses-devel xz-devel zlib-devel
#download packages
wget https://github.com/samtools/samtools/releases/download/1.17/samtools-1.17.tar.bz2
#解压
tar -jxvf samtools-1.17.tar.bz2
#编译
./configure --prefix=/home/lh/biosoft/samtools-1.17#进入samtools-1.17文件
make
make install#报错,如下
#***********************************************************************
[lh@localhost samtools-1.17]$ make install
gcc -g -Wall -O2 -I. -Ihtslib-1.17 -I./lz4  -c -o bam_rmdup.o bam_rmdup.c
bam_rmdup.c:31:18: fatal error: zlib.h: No such file or directory
 #include <zlib.h>
                  ^
compilation terminated.
make: *** [bam_rmdup.o] Error 1
#********************************************************************
#解决方法,如果下列包安装后仍无法解决,请自行百度错误提示
#下载   zlib-devel等包,后重新编译
sudo yum install zlib-devel
sudo yum install bzip2-devel
yum install -y xz-devel

方法 2: condaを使用してインストールする(強く推奨)

公式 Web サイトのインストール パッケージにはさまざまな問題がありますが、最も簡単な方法はcondaインストールを使用することです。

conda install samtools

インストールが成功したら、ヘルプを実行できます。結果があれば、インストールは成功です。


samtoolsの活用例

samtoolsツールは、.samを.bam形式のファイルに変換できます。これは、ゲノミクス、トランスクリプトミクス、エピゲノミクスの分野の研究に便利です。

(先排序后转换格式效率更高)。

詳細なパラメータと使用方法は公式ドキュメントで確認するか、**-h** を自分で参照してください

公式マニュアル: Samtools-Manual-CN by CNCBI

1. 仕分け

samtools sort input.sam -o output.sam#用法
samtools sort ly1_seq_mached.sam -o ly1_seq_mached_1.sam

2.形式を変換し、.samを.bamに変換します。

samtools view -bS input.sam > output.bam#用法
samtools view -bS ./ly1_seq_mached_1.sam > /home/cyh/Desktop/his_result_ly1/ly1_seq_mached_1.bam

または: .bam ファイルに直接並べ替えます。

samtools sort -@ 4 -o output.bam input.sam

-@ 4 は 4 つのコアを意味します

要約:

samtools view -b -h -F 0x04 -q 10 input.sam > output.bam
samtools sort output.bam -o output_sorted.bam
samtools index output_sorted.bam

コードの最初の行:

  • samtools: コマンドライン ツールの名前。
  • view: SAM ファイルの読み取りを表示するために使用されるコマンド オプション。
  • -b: 出力形式を BAM 形式に設定します。
  • -h: BAM ファイル内のヘッダー情報を保持します。
  • -F 0x04: FLAG 0x04 で読み取りをフィルターで除外します。つまり、修飾されていない読み取りをフィルターで除外します。
  • -q 10: MAPQ が 10 以上の読み取りのみを保持します。
  • input.sam: 変換する SAM ファイルのファイル名。
  • Output.bam: 出力を「output」という名前のファイルにリダイレクトします

「input.sam」は変換する SAM ファイルのファイル名、「output.bam」は変換された BAM ファイルのファイル名、「output_sorted.bam」はソートされた BAM ファイルのファイル名です。

このコマンドは、まず samtools view コマンドを使用して SAM ファイルを BAM 形式に変換し、FLAG 0x04 を持つすべての読み取りをフィルターで除外し (つまり、修飾されていない読み取りをフィルターで除外し)、MAPQ が 10 以上の読み取りのみを保持します。次に、出力された BAM ファイルをソートし、ソート結果を「output_sorted.bam」ファイルとして保存します。最後に、samtools Index コマンドを使用して BAM インデックス ファイルを作成します。


この記事の内容はここまでです この記事は私自身の勉強と実践に基づいており、多くの情報を参考にさせていただいています。如若有大佬能指出错误,我将感激

おすすめ

転載: blog.csdn.net/qq_74093550/article/details/131915248