基因预测软件

基因预测软件–Prokka

Prokka是一款快速对原核生物基因组进行注释的工具,可以在10分钟内完成对一个细菌基因草图的注释工作。适用于原核生物的基因组自动注释工具,由墨尔本大学生物信息学家Torsten Seemann 开发。Prokka协调了一套现有的软件工具,可以对原核基因组和宏基因组进行快速高效的功能注释。

1)软件安装
使用conda进行安装

conda install Prokka

2)软件使用
Prokka要求以FASTA格式的预组装基因组DNA序列为输入文件。本文中以最近发现的纤维素降解候选菌门——Goldbacteria门的Candidatus Goldbacteria bacterium(ID: 98965)的基因组进行注释。

自动搜索并添加数据库

prokka --setupdb

· 内置数据库有三个:ISfinder转座酶、NCBI的耐药基因、SwissProt数据库。
· 需要注释的文件格式为:fasta。
· 当有genbank或者蛋白序列的fasta文件时,可以加上选项–proteins(最好是genbank格式文件)

基本用法:

prokka --outdir <输出内容所在文件夹> --prefix <输出文件的前缀名> <需注释文件>

输出文件:
· .gff:GFF3格式文件
· .gbk:标准的Genbank格式文件
· .ffn:核苷酸fasta文件
· .faa:氨基酸fasta文件
· .txt:注释结果总的说明

基因预测软件–RAST

RAST(使用子系统技术的快速注释)是用于注释完整或几乎完整的组装的原核基因组以及完整噬菌体或质粒的一个工具,但它不能分析真核,小片段的基因组。它为整个系统树中的这些基因组提供了高质量的基因组注释。

1)RAST网站网址:http://rast.nmpdr.org/
2)账号注册
3)上传你要注释的基因组文件,要求为fasta或者Genbank格式
在这里插入图片描述

Prokka与RAST的比较

Prokka的设计既准确又快速, 为了评估准确性,文献中比较了Prokka,RAST和xBase2对大肠杆菌K-12基因组的注释,如下图所示:
在这里插入图片描述
END

Guess you like

Origin blog.csdn.net/weifanbio/article/details/121287419