GeneMark基因预测学习

(参考)

基因预测原理:宏基因组分析——基因预测篇

      宏基因组基因预测一般包括同源预测和从头预测。同源预测是通过与基因的同源序列比对,从而获得与已知基因序列最大匹配,其预测依赖于已知的基因信息,且不能注释出在数据库中缺少功能相似性序列的基因和新基因,计算资源消耗过大,时间花费过长。而从头预测是根据给定的序列特征来预测,主要依赖于在编码区和非编码区拥有不同特征的信息,并在统计学上进行描述,构建概率模型,用以区别编码与非编码区。

GeneMark使用教程: GeneMark使用教程 

GeneMark软件包是专为原核基因组和病毒基因组以及元基因组分析而设计的,可以预测基因,以及蛋白质编码区阅读框的位移。

makemat或GeneMarkS程序生成相应的GeneMark模型,GeneMark和GeneMark.hmm 进行基因预测。

下载

GeneMark:http://topaz.gatech.edu/GeneMark/

简要使用

gmhmmp $SampleOutputDirASS/$sample.contigs.fa -f G -A $sample.contigs.prot.fa -D $sample.contigs.nucl.fa -m MetaGeneMark_v1.mod -o $sample.gff

              说明:

                            软件: gmhnmmp

                            参数:    基本默认

                                          -f :指定输出的为gff格式

                                          -A :输出核酸序列

                                          -D :输出蛋白序列

                                          -m :宏基因组的模型(下载)

                            输出结果:   预测到的核酸(nucl.fa)、蛋白质序列(prot.fa)、基因位置信息(gff)

问题:MetaGeneMark_v1.mod 更多模型下载?

 

猜你喜欢

转载自blog.csdn.net/rojyang/article/details/81185846