基于全基因组的基因家族分析的初尝试

参考:简书https://www.jianshu.com/p/9f96fc7438aa

以搜索ZEB的人类的基因家族成员为例

一. 搜索已知数据库

1.在NCBI Gene上搜索ZEB1

 点击summary

点击domain

点击Gene就可以看到有相同结构的Gene了

2.在UniProtKB上下载protein family list

https://www.uniprot.org/help/family_membership

 在UniProtKB上搜索ZEB1获取UniProtKB的ID

在下载的文件(https://pan.baidu.com/s/1pu4eVyQKLBazyNY3RH80eg    password:ihij)中搜索P37275

 选择HUMAN的即为同家族的基因

3.或者在Ensemble数据中搜索

点击即可查看基因家族(好像结果不是很全) 

4.或者参考    如何获取一个基因家族的所有小麦基因

https://blog.csdn.net/msw521sg/article/details/76606086

二.通过Hmmer工具鉴别基因家族

参考:https://www.jianshu.com/p/963452cda9f1

1.下载人类的基因组

http://www.ensembl.org/info/data/ftp/index.html

得到DNA.fa   CDS.fa   protein.fa  gene.gff3

2.获取HMMer的输入文件.hmm

 

在pfam上搜索http://pfam.xfam.org/search#tabview=tab1

 

 

 

 对于在NCBI Gene上没有对于的PFamID 或者有多个PFamID的可以从PATHER上下载HMM文件

http://www.pantherdb.org/

 

 

 

得到了HMMer的输入文件 .hmmer

3.运行HMMER 

HMMER的用法http://www.360doc.com/content/17/0823/08/33204118_681408029.shtml

安装:tar -zxvf hmmer.tar.gz

./configure --prefix=/home/taotao/Download/hmmer_install --enable-threads

make

make check

make install

猜你喜欢

转载自blog.csdn.net/huyongfeijoe/article/details/81605021