AI药物研发大赛培训来啦!清华博导讲解,高分基线等你来Fork!

d004a7a1a3dee8ef5a119f45845d0105.gif

首届全球AI药物研发算法大赛,是由清华大学药学院、百度飞桨、百度智能云和临港实验室共同主办,并得到中国药学会等单位大力支持的一项全球性技术创新大赛。旨在借助百度飞桨在生物计算方向上的算法优势,通过AI Studio平台,探索AI+药学领域前沿技术,挖掘和培育优秀人才。上线一个月以来,吸引了来自全国200余所高校、100余企业的500余支队伍、600余名选手参加。

e6c314a7af4d81eef392f8eacb8e00cc.png赛题背景

b95edfdaa573fd7f98c72b3d6e1e424b.png

新冠病毒(SARS-CoV-2)自从其首次爆发以来,迅速成为全球关注的焦点。为了抵御新冠病毒的攻击,了解病毒的复制和感染机制至关重要。主蛋白酶(main protease, 简称M pro)是新冠病毒的关键酶,负责在感染过程中剪切病毒产生的蛋白质前体,促进病毒的复制。 主蛋白酶因其在病毒生命周期中的关键作用,成为潜在的治疗靶点。抑制该酶的活性可以有效干扰病毒的复制过程,从而提供一种潜在的治疗方法。

其中,人工智能的筛选方法,利用机器学习和深度学习技术,分析大量结构和活性数据,从而实现对小分子与主蛋白酶之间相互作用的预测。

本次比赛旨在鼓励参赛者利用人工智能方法,发掘治疗新冠病毒的潜在药物。

赛题链接

https://aistudio.baidu.com/aistudio/competition/detail/1012/0/introduction

赛段设置

9c4366d14fcd7b4a1390ad29ccce9592.png

887863a9b36606ae25dcb48d724e382e.png赛题任务解析

f3d6cb7cdfa9ad657249ac685a789fb4.png

初赛阶段

大赛提供小分子对新冠病毒主蛋白酶的抑制活性数据,参赛选手可以使用深度学习、分子对接等方法进行建模,预测小分子抑制主蛋白酶活性的概率。

即给定分子(SMILES),预测抑制主蛋白酶活性的概率。

7dc5ec3bd59167037c0abcd991e71e17.png

复赛阶段

大赛提供小分子在Caco细胞上抑制新冠病毒复制的活性数据,参赛选手需要基于PaddlePaddle进行模型的设计和训练,预测小分子在Caco细胞上抑制新冠病毒复制的概率。

即给定分子(SMILES),预测Caco细胞上抑制新冠病毒复制的概率。

360b46593b25b9de6c5268253bdb15a6.png

评估指标

本次比赛选用AUC(ROC曲线下面积)和AP(PR曲线下面积)的平均值作为评估指标。

be3c43dea87ed0e65d9d9e82e341f624.png

Baseline链接

https://aistudio.baidu.com/aistudio/projectdetail/6251614?sUid=83027&shared=1&ts=1685016258784

9d2d781a9a7d3a980f418d397a312156.png

赛题培训

7月1日(本周六)晚七点入门培训来了!为了帮助更多新同学了解和入门比赛,本次培训特邀清华大学药学院研究员、博士生导师田博学、清华大学药学院博士生陈靖轲、百度飞桨Jungle老师担任讲师!带领同学们深入了解本次赛题任务的产业背景、赛题任务和破题技巧,逐行理解baseline的全流程代码!

204caab96a5164c21e3cb22fa9888a49.png

田博学‍‍‍‍‍‍‍‍

清华大学药学院研究员,博士生导师‍

主要从事计算化学和计算生物学相关研究‍‍‍‍‍‍

12d7c2539c75154aeaef38b091992726.png

陈靖轲‍

清华大学药学院博士生

零基础入门,一举通关比赛任务!

赛事官方交流群

6afeb59a399badfdce506fb93408508a.png

4cd4102ae87f9cfeee92b99144192665.gif

关注【飞桨PaddlePaddle】公众号

获取更多技术内容~

猜你喜欢

转载自blog.csdn.net/PaddlePaddle/article/details/131447558