星药科技李成涛：人工智能在药物研发中的应用

不到现场，照样看最干货的学术报告！

嗨，大家好。这里是学术报告专栏，读芯术小编不定期挑选并亲自跑会，为大家奉献科技领域最优秀的学术报告，为同学们记录报告干货，并想方设法搞到一手的PPT和现场视频——足够干货，足够新鲜！话不多说，快快看过来，希望这些优秀的青年学者、专家杰青的学术报告，能让您在业余时间的知识阅读更有价值。

人工智能论坛如今浩如烟海，有硬货、有干货的讲座却百里挑一。“AI未来说·青年学术论坛”系列讲座由中国科学院大学主办，百度全力支持，读芯术、paperweekly作为合作自媒体。承办单位为中国科学院大学学生会，协办单位为中国科学院计算所研究生会、网络中心研究生会、人工智能学院学生会、化学工程学院学生会、公共政策与管理学院学生会、微电子学院学生会。2020年8月29日，第18期“AI未来说·青年学术论坛”（“AI+X”领域专场）以“线上平台直播+微信社群图文直播”形式举行。星药科技李成涛带来报告《人工智能在药物研发中的应用》。

星药科技李成涛的报告视频

星药科技创始人&CEO李成涛博士本科毕业于清华姚班，随后在麻省理工学院获得计算机博士学位。他曾先后在人工智能顶级会议上发表多篇论文，其研究成果落地在药物发现领域中的多个重要环节。

人工智能在药物研发中的应用

李成涛博士的报告内容是关于人工智能在药物研发的应用，内容涉及到一些落地的应用以及人工智能在药物研发流程当中的具体地位。整个药物研发流程是一个非常漫长的过程，大概分为两个阶段：临床许可是分界线，之前是候选药物阶段，之后是临床实验阶段。临床实验可能大家耳熟能详，以这次新冠疫情为例，大家可能知道有些国家已经有一些相关的临床实验，具体来说就是现在开发了一款新药或者使用已有的药，进一步想要尝试该药在新冠病人身上能不能发挥作用。此时就需要招募一些病人在医院当中尝试这样的新药，看一看最终的反应，到底是不是像想象的那样可以痊愈，之后药品可能就会上市。临床之前也需要很多类似的过程，从靶点开始。生病吃药其实本质上就是一个调控体内蛋白质的方式，服用的药物小分子在体内会与相应的蛋白质进行结合，调控蛋白质功能，这个蛋白质就是所谓的靶点。根据靶点的性质和三维结构，可以设计一些药物，经过一系列的设计、筛选、优化，再到体内外的实验，测试一下有效性和毒性。如果一切顺利就进入临床许可阶段，如果不行的话可能需要回去返工，重新优化分子的性质，让它能够达到实验想要的目的。整个流程是非常长的，大概需要五到八年的时间。

如此长的研发时间和投入也对应着更多的研发成本。现在平均每一款药的研发成本将近30亿美金，是非常昂贵的。药物研发领域其实出现一个非常奇怪的现象，叫做EROOM定律(Eroom’s Law)，即摩尔定律（Moore’s Law）的反向。大家普遍会期待随着时代进步、科技进步，药物研发成本会逐渐下降，但是药物研发领域的成本其实是逐渐上升的。现在这个阶段需要投入巨大的人力物力，也需要花费巨量的时间和财力，才能做出一款药物。与之相反的是这么大的投入换来的是不够对等的回报。从2010年开始，研发投入的回报率是逐年走低的，从2010年的10.1%到2018年的1.9%。目前整个产业处于这样一个状态，一方面成本非常高、研发时间非常长，另一方面大家做出来之后又赚不到多少钱，所以业界这边就一直在思考怎样找到一个非常好的方式，能够降本增效。

人工智能近年来有爆发式发展，ImageNet、硬件算力和各种各样的算法导致很多领域都有了优化的场景，对于医疗影像，AI可以帮助医生来做诊疗的判断，其他方面，例如自动驾驶做得很好，AlphaGo关于围棋的应用也非常不错。AlphaGo的核心算法其实跟药物研发是非常近的关系，李成涛博士会在后面会介绍AlphaGo是如何应用到药物研发场景当中的。

AI能够提供的价值主要是药物研发的前期部分。从刚开始的靶点识别到根据靶点的三维结构等信息进行分子设计、筛选和优化，找到一些和靶点有相互作用的小分子。现在所有的这些东西都是在电脑当中，需要把它合成出来才能做各种各样的实验。所以怎样才能合成这些新的分子也是一个很大的议题，这就涉及到合成路径的设计。AI提供的落地场景还是很多的，本次报告主要讲的就是关于分子设计优化以及合成路径设计的内容。

李成涛博士首先介绍了分子设计优化。很多同学都知道紫杉醇是抗癌的天然产物。为了让计算机能够读取分子信息，有两种信息表达的方式可以表示整个紫杉醇分子。第一种是将整个分子都序列化，每一个序列都会唯一地对应一个分子，这里可以应用到NLP相关的技术，后续会做介绍。另外一种更加直观，如上图中右图所示，把整个结构看成一张图，每个原子表示成一个图里的节点，不同原子是不同颜色的节点；不同的化学键，可以表示成不同的边，所以现在既有不同的节点也有不同的边，组成了这样一个Molecular Graph（分子图）。它本质上在计算机里面是一个邻接矩阵加上性质的标签。这是现有的两种比较有代表性的表示方式。

根据前面描述的内容，如果要做分子生成，可以把问题转变为一个序列生成问题。序列生成有很多方法，报告中举的例子是直接用VAE，即把序列作为输入，输出也是序列，使用编码解码网络。做过NLP的同学基本上都比较清楚。编码网络和解码网络的中间的Latent Space就是把整个Continuous Space离散化了，对应的每个Local Part就是特异的分子，通过从整个空间当中Sample一些比较想要的分子来达成目的。

但是如果直接用SMILES String作为分子的Input和Output，直接产生序列有很大的弊端。第一点是它本身有一定的语法，从而在Decoding的时候不一定每次都能够Decode在语法上正确的分子；第二点，即使能够Decode语法上正确的分子，但是某些原子的价位可能不太一样，或者某些原子此时不能接这个基团，否则在化学意义上会有语义上的错误，这个问题是很难避免的；第三点，结构相似的分子可能有完全不一样的SMILES String，如上图底部所示，最下面有两个分子，它们在结构上是非常相似的，化学上普遍认为结构相似的分子有相似的性质，进而希望它们的表示方式尽可能相似。实际上，左边分子和右边分子的SMILES String是完全不一样的，这就给做序列模型提出了比较严峻的挑战，进一步转换思路采用另外一种方法。本质上，序列的编码和解码对应的是把整个的二维图结构变成了一维序列信息，原本二维结构图里面的结构信息在一维序列里面不是很好发掘。

另外一种方法就是直接用图作为输入和输出，图本身是一个邻接矩阵，所以计算机可以读取。现在面临的是全新的输入和输出，第一个问题是怎样编码一个图，涉及到最近比较火的图神经网络。如上图所示，现在有一个分子图，放到计算机里面，每个原子都有一个对应的向量，设计多层的Message Passing机制，每个原子对应的向量可以和邻近的向量进行信息交换。比如蓝色的会和邻居以及自己进行信息的整合和交换，最后达到所有原子上都有一个编码邻近信息的向量，最后通过把所有的向量都整合到一个向量里，直接做加和或者平均。

下一步是怎样解码，之前并没有特别好的解码方法从一个定长的向量当中解码出来不定大小的图。不过最近已经出现了很多的方法，这里以JTVAE为例进行介绍。很多分子当中都有一些常见的基团，苯环在很多有机化合物当中都会出现。五元杂环也算是一个基团，也可以抽象出来，这些东西都抽象出来之后变成一个点。如果把所有环类的东西都抽象成一个点，由于图中就没有环了，一个无环的连通图就是一棵树。树做Encoding和Decoding就相对容易一些，原本每次生成一个原子需要考虑生成之后怎么和已有的原子进行连接，但是现在不需要考虑环的情况，只需要考虑树的情况，而树是可以直接用RNN生成的。如上图所示，每个节点有两个方向的生成，一个生成Children，另一个生成Siblings，直到每个节点都选择停止，这个时候整个Encoding或者Decoding就完成了，加上树和图之间可以进行相互转换，最后就得到一个从图到图的VAE，即Junction Tree VAE。

知道了做VAE的Encoding和Decoding，Training和Generation也相应可以明确。Training即拿一些图作为输入和输出，然后去做Auto Encoding。Generation是在Training之后直接用解码器，在隐空间中采样一些定长的向量，然后解码成一些图，这个图是分子图，每个分子图是一个分子，所以已经达到了生成分子的目的。

关于合成路径设计，李成涛博士对具体思路进行了介绍。AlphaGo对化学合成路线设计有一定的启示作用。围棋每一步都有数十种、上百种可能性，每次都可能在棋盘的空位落子，每一步都会造成之后策略的相应调整。下围棋的最终目标是赢，但是要下几百步才能知道到底是赢还是输，所以需要搜索的空间是非常大的，需要搜索几百步，搜索空间是巨量的。当时AlphaGo是用MCTS做了这些估算，然后找到一些相对来讲非常好的路径做了搜索。这些东西和化学逆反应合成有一定的关系。入上图所示，绿框里面的分子是想要合成的分子。最开始无法知道怎么合成，但是知道图中A和B可以经过几步合成目标分子，把A和B分别的合成路径不断往回倒推，直到出来的分子可以直接买到时停止。这个概念就像打游戏要合成一些游戏装备，最开始需要合成非常基础的东西，然后逐渐地往上合成，一直到最后能够合成出来非常高级的装备，它们本质上是一样的。

星药科技本质上做这个合成是往回倒推的过程，其中最大的问题是搜索空间是非常大的。假如要合成A，对于A来讲可以有很多种可能的合成方式，B和C、B和D、C和E都可以合成A，但是现在B和D不知道怎么合成，可能E和F可以合成D，或者H和G可以合成D，所以每一步其实都有几十种甚至上百种合成方式，每决定一条路、每决定一步其实对后面的合成方式会有一定的影响。可能某一次选择的是B和D，下次可能选择B和C，这个时候目的是要合成B和C，而不是合成B和D，它们之间有很大的差别。最终目标就是找到一种可行的合成方式，涉及到非常巨大的搜索空间，造成了计算的复杂度，实际上它可以用蒙特卡洛树搜索的方式来做。

2018年有研究人员在《Nature》上发表了一篇论文，通过蒙特卡洛树搜索的方法找到可行路径，也是第一次通过Deep Learning加上RL来做到以前大家都做不到的事情。目前为止仍然有很多的化学物质其实是不知道怎么合成的，AI可能会为它们提供一些新的思路。

化学合成的AI方法分为单步逆反应预测和多步逆反应搜索，目前有很多的论文在做这件事情，尤其是最近两年。星药科技和Google Brain、MIT、蚂蚁金服的研究人员一起做了一系列相关的工作，在NeurIPS和 ICML上发表了数篇关于单步和多步反应的文章，大家感兴趣的话欢迎去关注。

星药科技去年下半年才成立，是一家非常年轻的公司。我们想要通过人工智能来基于靶点设计、筛选和优化分子，目的就是希望尽可能降低整个药物研发的成本，能够让药物研发的时间缩到更短，也能够让合适的药物到达患者手中。星药科技去年年末入选默克加速器，同时获得了包括高榕、源码、DCM、晨星这些基金的支持和认可，现在他们也在积极地开展合作，包括一些知名高校科研机构，国内的上市药企都是星药科技的合作伙伴。非常欢迎感兴趣的同学可以联系星药科技公司([email protected])对这一块做交流和探讨。

（整理人：张雪丰）

AI未来说*青年学术论坛