RDKit | 基于化合物结构式图像估算分子式(OpenCV、CNN)

简介

当通过深度学习输入有机物质中结构式的二维图像时,需要解决寻找分子式的问题。这是一个回归问题,需要计算结构式图像中包含的碳,氢,氧和氮等原子数。

基于化合物结构式图像估算分子式

环境

系统 :Win10

工具:RDKit、OpenCV、Keras、TensorFlow

任务步骤

  1. 训练数据300,000种化合物的SMILES字符串(足够的训练数据)
  2. 输入结构的二维图像可以提供足够的信息来理解分子结构。

使用RDKit将SMILES字符串转换为结构式图像,并进行了学习以计算图像中的原子数。

数据预处理

提取获得如下数据

猜你喜欢

转载自blog.csdn.net/u012325865/article/details/103777037