numpy的vectorization
arrays很重要因为它提供了可以批处理数据而不需要写任何for循环,叫做vectorization;
化合物描述符向量化及相似性检索
导入库
import pandas as pd
from numpy import vectorize as vec
from rdkit import Chem
from rdkit.Chem.Draw import IPythonConsole
from rdkit.Chem import Descriptors,PandasTools
from rdkit.Chem.AllChem import Compute2DCoords
载入数据并查看
mols = PandasTools.LoadSDF("cdk2.sdf",smilesName='SMILES',molColName='Molecule',includeFingerprints=True)
mols.head()
可视化分子