KEEG step by step

核心概念

  • KEEG:Kyoto Encyclopedia of Genes and Genomes,生物高水平功能是数据库。如果不是使用服务器来查询数据库,需要付费。
  • KO:KO就是给每个已知功能(function)进行编号的数据库。所有数据库里的功能都有这个编号,但是每个功能又还有别的编号,因为每个对象都同时扮演多个角色,存在于多个子数据中。
  • Pathway:多个功能,组成一个通路。
  • Module:多个通路组成一个模块。
  • Brite:一个功能可能在不同的模块或者通路中起作用,Brite 数据库存贮这种交叉关系。
  • Chemical information:化学物质信息,功能都依附于物质,所以不同的物质有自己的编号。分为以下4类。
    • Compound(C):圆圈
    • Glycan(G):多糖,这是
    • Reaction(R):线
    • Enzyme(E):方框
      硝酸盐转运基因
  • 分类
    • Organism:数据库里不同物种的注释结果。每个物种用三个字母表示,例如 hashomo sapiens
    • Subject:根据研究范围不同进行分类。包括癌症、植物、病原菌、病毒等。
  • Tools:回答序列与基因的对应关系,并把一系列基因放到通路或者模块中。
    • BlastKOALA:比对基因组的蛋白质序列(aa)中是否含有数据库中的序列。
    • GhostKOALA:比对转录组的蛋白质序列(aa)中是否含有数据库中的序列。
    • Mapper:在 pathway,模块,brite里搜索,也可以在特定物种中搜索。
      • Reconstructe:完成在线注释之后会得到结果。里面有重构选项。
      • Search:搜索几个基因,就能完成重构。
      • Color:能按照自己的需求来进行配色。例如强调某个基因。

这些都是在线完成的,所以网速是硬伤。

基本流程

        1               2             3
Contigs ->  Amino acids -> KO numbers -> Maps
  1. 从测的核酸序列到预测的氨基酸序列;
  2. 在数据库中找是否有相似的氨基酸序列;
  3. 把同一批的序列放到代谢通路,模块或者功能关系中。

氨基酸序列

实际上KEGG要的是氨基酸序列,但是我们不总是能直接拿到氨基酸序列,比如早起的NCBI序列就可能没有注释,或者作者当时没选注释。如果是这种情况,就需要自己注释,使用Prokka,10min就能完成,但是你还是不会,那不如上传到NCBI,请他们来注释,大概等个7天,也就好了。

注释

  1. 上传的时候选择参考物种,或者只选大类,真核原核。
  2. 收到邮件,点击submit。如果不想注释了就点 cancel,不然这个邮箱就不能用。
  3. 收到注释完成的邮件,完成。

保存结果

  • 进入链接(只有7天有效),在链接里能下载结果。

    P0001 K0111111 protein

  • 这里能看到构建的通路,模块或者关系,但是光下载这一页是不能保存其中的图的。
  • 可以下载特别感兴趣的部分,如果需要再次重构,就把下载的文本文件上传到Reconstruct Pathway

结果说明

  • Pathway:会有一副完整的代谢通路图,和其他的细节图。
  • Module:这里会显示出一个模块是否完整,是不是所有需要的基因都存在。
  • Brite:能看到基因都被放到哪些关系中了。这里不会出图。
    结果

应用

对细菌功能的了解程度决定了你能提出什么问题,去哪里找答案。
如果你知道20E测试中对应的是哪个代谢途径,哪个关键酶,就能看看基因组中是不是有对应的基因。
如果你不知道,那么可以搜对应的底物,也能知道这个过程与什么基因相关。

辅助鉴定

  • 细菌是否有运动性:进入 Pathway cell motility
  • 硝酸根还原,ABC-transporter:能不能厌氧生长。
  • 脂肪酸的合成模块
  • 碳源利用里相关通路是不是断了,能决定唯一碳源的结果

高级应用

挖掘出细菌的特殊功能,能大幅提高文章的重要性。

  • 从芳香族化合物降解
  • 能利用氨基酸作为唯一碳源
  • 有光合自养能力
  • 参与硫代谢
  • 抗生素合成
  • 从信号通路猜测对元素的抗性
  • 代谢通路重构的时候运行同时上传几种物种注释信息,这样个物种会有自己的颜色。

比较两个细菌的芳香族化合物的代谢通路

# organims 1
gene1   K02874
gene4   K00416
# organism 2
gene7   K12864

https://files.cnblogs.com/files/Xeonilian/merge.txt.css
https://www.kegg.jp/kegg-bin/blastkoala_result?id=82ac4904c56bf41cddc9cf94353fa2b731177a18&passwd=L9IqAn&type=blastkoala

猜你喜欢

转载自www.cnblogs.com/Xeonilian/p/10110134.html