.fa .fna和.fasta是同一种格式文件吗?

.fa .fna和.fasta是同一种格式文件吗?

fasta与fastq的区别:
fasta格式(格式缩写为fa)是一种存储核酸或氨基酸序列的文本格式 ,允许在序列前定义名称和编写注释。 已成为生物信息学的标准格式,格式简单,多种文本处理工具和 Python等脚本语言处理均可对其直接处理。结构分两行,第一行序列标识(ID),第二行为序列信息。
fastq格式(格式缩写为fq)是一种存储生物序列和对应序列质量的文件格式。 现已成为存储高通量测序数据的事实标准,相当于fasta的plus(+quality)版。结构分为四行,第一行序列标识(ID),第二行为序列信息,第三行为单独一个+(表示与第一行相同的序列标识,为了节省内存省略为+,此行保留以凑成偶数行保证后续数据处理的便捷性),第四行,对应第二行序列的质量值(用ascii码表示,通过质量值公式可以计算其准确度)。

fna,ffn,faa都属于fasta格式:
fna (fasta nucleic acid file)所有核酸序列信息
ffn (fasta nucleotide coding regions file)所有基因的核酸序列信息
faa (fasta Amino Acid file) 即所有基因对应的蛋白质序列信息

*.faa = FASTA Amino Acid file 其内容是物种内所有基因对应的fasta格式的蛋白质序列信息
*.ffn = FASTA nucleotide coding regions file其内容是物种内所有基因的DNA序列信息,fasta格式
*.fna = FASTA Nucleic Acid file其内容是使用fasta格式表示的物种全序列DNA信息。
.fa 是.fasta的缩写

fna是fasta文件的变体

所谓FASTA是指DNA 序列第一行开始于一个标识符:">",紧接着(没有空格)是对该序列的唯一描述(即ID),然后一个空格,接着是对该序列的描述(也可以没有),从第二行开始就是一行行的序列,中间的空格,换行没有影响。

おすすめ

転載: blog.csdn.net/u010608296/article/details/121428098