RDKit | 化合物描述符向量化及部分结构检索

numpy的vectorization

arrays很重要因为它提供了可以批处理数据而不需要写任何for循环,叫做vectorization

化合物描述符向量化及相似性检索

导入库

import pandas as pd
from numpy import vectorize as vec
from rdkit import Chem
from rdkit.Chem.Draw import IPythonConsole
from rdkit.Chem import Descriptors,PandasTools
from rdkit.Chem.AllChem import Compute2DCoords

载入数据并查看

mols = PandasTools.LoadSDF("cdk2.sdf",smilesName='SMILES',molColName='Molecule',includeFingerprints=True)
mols.head()

可视化分子

猜你喜欢

转载自blog.csdn.net/u012325865/article/details/103859434
今日推荐