“RDKit | 化学信息学与AI”专栏介绍
介绍RDKit相关知识点和运用以及RDKit作为处理化学、生物、药学和材料学科中分子数据作为可输入机器学习和深度学习模型的重要工具应用。内容涵盖了基于RDKit的Python3的分子的读写、化合物的分子指纹和分子描述符计算、化合物的2D/2D比对、化合物相似性搜索、化合物骨架分析和亚结构搜索、RMSD计算与构象生成优化、分子相似图与聚类分析、化学反应处理、可视化与化学空间探索及RDkit相关的机器学习、深度学习应用过程详解。
“RDKit | 化学信息学与AI”专栏地址:https://blog.csdn.net/u012325865/category_9278913.html
RDKit简介
开源化学信息学工具包
- RDKit在2000-2006年期间在Rational Discovery开发和使用,用于构建吸收、分布、代谢、代谢、毒性和生物活性的预测模型。
- 2006年6月Rational Discovery被关闭,但该工具包在BSD许可证下作为开源发布。
- 目前,RDKit的开源开发由诺华积极贡献,其中包括诺华捐赠的源代码。
RDKit特点
- 商业友好型BSD许可证
- 核心数据结构和算法由C ++编写
- 使用Boost.Python生成的Python 3.x包装器
- 用SWIG生成的Java和C#包装器
- 2D和3D分子操作
- 机器学习与深度学习的分子指纹和分子描述符生成
- PostgreSQL分子数据库集成
- KNIME的化学信息学Node
RDKit提供各种功能,如不同的化学I/O格式,包括SMILES/SMARTS,结构数据格式(SDF),Thor数据树(TDT),Sybyl线符号(SLN),mol2和蛋白质结构文件(PDB)。子结构搜索; 标准SMILES; 手性支持;化学转化;化学反应;分子序列化;相似性/多样性选择;二维药效团;三维维药效团;分层子图/片段分析; Bemis和Murcko骨架;逆合成组合分析及分子碎裂(RECAP); 多分子最大共同亚结构;功能图;基于形状的相似性;基于RMSD的分子比对;基于形状的对齐;使用Open3-DALIGN算法的无监督分子-分子比对;与PyMOL进行3D可视化集成;功能基团过滤;分子描述符库;相似图;机器学习等等
RDKit安装
Linux(CentOS 7_x64位)系统下安装RDkit
Linux(CentOS 7_x64位)系统下安装RDkit(修正)
基于RDKit的分子读写及入门
RDKit | 基于RDKit输出分子结构图(Image)的方法
基于RDKit的分子指纹与描述符计算
分子指纹
RDKit:化学指纹(Chemical Fingerprinting)
分子描述符
RDKit | 基于RDKit描述三维分子形状(3D描述符)
基于RDKit与Python3的构象与RMSD计算
基于RDKit与Python3的相似性与分子图
RDKit:化合物亚结构(Substructure)搜索(基于Python3)
RDKit toolkit实战二:Generating Similarity Maps Using Fingerprints
RDKit与药效团
RDKit | 聚类分析与可视化
RDKit与化学反应
RDKit | 基于RDKit通过SMARTS定义反应模式来生成反应产物
RDKit与PostgreSQL
CentOS 7 源码编译安装 PostgreSQL 11.2
基于RDKit与Python的应用
RDKit | 通过评估合成难度(SA Score)筛选化合物
RDKit | 天然产物的相似度评分(NP-likeness)
基于RDKit的Python脚本:SDF格式转SMILES格式
RDKit与AI、深度学习和机器学习
药物设计的深度学习(Deep Learning for Drug Design)
RDKit | 基于Pytorch和RDKit建立QSAR模型
RDkit&mol2vec :基于逻辑回归的靶标抑制剂活性二分类对比
RDKit | 基于随机森林(RF)的机器学习模型预测hERG阻断剂活性
RDKit | 基于不同描述符和指纹的机器学习模型预测logP
RDKit | 基于RDKit和scikit-learn的KNN模型预测Ames的致突变性
RDKit | 基于化合物结构式图像估算分子式(OpenCV、CNN)