[Python は fasta ファイルを複数の小さな fasta ファイルに分割します] - コードワールド

[Python は fasta ファイルを複数の小さな fasta ファイルに分割します]

開発 2023-07-02 02:07:19 訪問数: null

#fastaをN個の部分に分割
import sys 
import pandas as pd 
import os 
#ここに判定パラメータを書きました。入力パラメータはここにあります: pyファイル、faファイル、分割数、出力フォルダ
if len(sys.argv)>3 and len( sys.argv)<5: 
    fasta=sys.argv[1] #read file 
    n=sys.argv[2] #数値に分割
    n=int(n) 
    out_file = sys.argv[3] #path 
#ディレクトリが存在する、存在しない場合は作成
    os.path.exists(out_file): 
        os.mkdir(out_file) 
#入力ファイルを処理し、別のファイルに保存します; ここでは主にすべてのファイルを 1 行に処理するため、これが便利ですフォローアップ用 N 個の部分に分割
    fr = open(fasta, 'r') 
    fw = open('fa.fasta', 'w') 
    seq = {} 
    for line in fr: 
        if line.startswith('>') : 
            name = line.split()[0] 
            seq[name] = ''
        それ以外の場合:
            seq[name] += line.replace('\n', '') 
    for i in seq.keys(): 
        fw.write(i) 
        fw.write(':') 
        fw.write(seq[i]) 
        fw.write('\n') 
    fr.close() 
    fa_file =pd.read_table('fa.fasta') 
    num = 0 
#入力フォルダー
    os.chdir(out_file) 
    for i in range(1,n +1) を入力します): 
        start = num 
        num = num +int(fa_file.shape[0]/n) 
        file =fa_file.iloc[start:num] 
#各ファイルを入力フォルダーに保存
        file.to_csv( str(i ) + "transcripts_mRNA. fa"、index=False) 
else: 
    print(f"Usage:\n\tpython {sys.argv[0]} input.fa split_num out_dir\n")

おすすめ

転載: blog.csdn.net/whiteof/article/details/123685985

[Python は fasta ファイルを複数の小さな fasta ファイルに分割します]

線形化ファイルのFASTA FASTQ

perlのマルチFASTAファイルが一致し、第1のシーケンスは、ファイルに一致抽出

seqtk高速処理FASTA / FASTQファイルアプレット

PythonはPDFファイルを複数のページに分割します

Pythonは複数の辞書を同じCSVファイルに出力します

Python は複数のフォルダーにアクセスし、要件を満たさないファイルを消去します

Pythonは：複数のファイルを読み込むと、特定のファイルの出力を保存します

PHP は、大きな csv ファイルを複数の小さなファイルに分割し、シーケンス番号に従ってそれらのファイルに名前を付けます。

複数のPDFファイルにPDFファイルを分割するには？あなたのPDFファイルの分割方法を教えます

Python は複数のフォルダー内の .csv ファイルをバッチで .h5 ファイルに変換します

Python は小さな関数を実装しています - ファイル内の特定の文字列を置き換えます

Python は複数のサブフォルダーをループし、ファイル名の特性に基づいて異なる宛先フォルダーにファイルをコピーします

Pythonは - 複数のサブフォルダ内のテキストファイルに参加します

Pythonはtxtファイルをcsvファイルに変換します

Python では、py ファイルを pyd ファイルに変換します

Perlの重複排除FASTAシーケンス

Pythonの少しの運動：バルクは、同じフォルダに複数のファイルを削除します

Python ではファイルを開くときに open を使用します。ファイルが存在しない場合は自動的に作成されます。

複数のファイルの名前またはサフィックスを大文字から小文字に変更する Python メソッド

fasta.img 是什么文件？

Python はヘッダーを削除し、複数の Excel ファイルをマージします

PythonはPDFファイルを1つのファイルに結合することを実現します

Pythonはglobを使用して、複数のテキストファイルまたはExcelファイルを読み取ります（一度に複数のファイルを読み取ります！サフィックスを指定するだけです）

保存Pythonのmatplotlibのは、PDFファイルに複数のビューを描きます

PDFファイルは、複数のPDFファイルに分割する方法？

Python3は、保存ファイル内の複数の空のファイルの問題を解決します

バイトストリームファイルには、複数のファイルを含むzipファイルを使用して生成されます

Pythonの印刷出力は、指定したファイルの内容に保存されます

Python はフォルダー内のファイルを走査し、必要な時間に応じてファイルを削除します

おすすめ

ライナスは「ドッグフードを食べる」ことに最も積極的！

Open Source Daily | Winamp プレーヤーがオープンソースになりつつある; 生成 AI の戦いは第 2 ラウンドにエスカレート; AI はバブルの初期段階に入った; Yongming を Alibaba Cloud に導入しますか?

ランキング

C言語プログラミングの最新の方法（第2回）第12章回答（自分で書いた回答、継続的に更新）

フレームワークの蜂のアップロードファイルに移動します

タイトルバーシリーズ：タイトルバーで遭遇したピットを非表示にする

Unityはゲームオブジェクトの様々な状況を取得します

N個の異なるボールは、Mどのように多くの種類のプログラムのと同じ袋に入れられますか？

オブジェクト指向のクラス、オブジェクト21

C ++オブジェクト指向プログラミングの研究ノート（8）

P3954 [NOIP2017 普及组] 成绩

分業のプロセス間通信 - ロック

ハッカーは通常、DOSコマンドウィンドウを使用します

アーカイブ

もっと

2024-05-20(5)

2024-05-19(0)

2024-05-18(30)

2024-05-17(6)

2024-05-16(24)

2024-05-15(5)

2024-05-14(9)

2024-05-13(8)

2024-05-12(27)

2024-05-11(31)