简介
当通过深度学习输入有机物质中结构式的二维图像时,需要解决寻找分子式的问题。这是一个回归问题,需要计算结构式图像中包含的碳,氢,氧和氮等原子数。
基于化合物结构式图像估算分子式
环境
系统 :Win10
工具:RDKit、OpenCV、Keras、TensorFlow
任务步骤
- 训练数据300,000种化合物的SMILES字符串(足够的训练数据)。
- 输入结构的二维图像可以提供足够的信息来理解分子结构。
使用RDKit将SMILES字符串转换为结构式图像,并进行了学习以计算图像中的原子数。
数据预处理
提取获得如下数据