参考:简书https://www.jianshu.com/p/9f96fc7438aa
以搜索ZEB的人类的基因家族成员为例
一. 搜索已知数据库
1.在NCBI Gene上搜索ZEB1
点击summary
点击domain
点击Gene就可以看到有相同结构的Gene了
2.在UniProtKB上下载protein family list
https://www.uniprot.org/help/family_membership
在UniProtKB上搜索ZEB1获取UniProtKB的ID
在下载的文件(https://pan.baidu.com/s/1pu4eVyQKLBazyNY3RH80eg password:ihij)中搜索P37275
选择HUMAN的即为同家族的基因
3.或者在Ensemble数据中搜索
点击即可查看基因家族(好像结果不是很全)
4.或者参考 如何获取一个基因家族的所有小麦基因
https://blog.csdn.net/msw521sg/article/details/76606086
二.通过Hmmer工具鉴别基因家族
参考:https://www.jianshu.com/p/963452cda9f1
1.下载人类的基因组
http://www.ensembl.org/info/data/ftp/index.html
得到DNA.fa CDS.fa protein.fa gene.gff3
2.获取HMMer的输入文件.hmm
在pfam上搜索http://pfam.xfam.org/search#tabview=tab1
对于在NCBI Gene上没有对于的PFamID 或者有多个PFamID的可以从PATHER上下载HMM文件
得到了HMMer的输入文件 .hmmer
3.运行HMMER
HMMER的用法http://www.360doc.com/content/17/0823/08/33204118_681408029.shtml
安装:tar -zxvf hmmer.tar.gz
./configure --prefix=/home/taotao/Download/hmmer_install --enable-threads
make
make check
make install