RDKit | 基于RF和SVM的溶解度预测模型比较 - 代码天地

RDKit | 基于RF和SVM的溶解度预测模型比较

其他 2020-01-15 10:36:01 阅读次数: 0

随机森林与支持向量机

随机森林

目的

随机森林是一个用随机方式建立的，包含多个决策树的分类器。其随机性主要体现在两个方面：(1)训练每棵树时，从全部训练样本(样本数为N)中选取一个可能有重复的大小同样为N的数据集进行训练(即BootStrap取样)；(2)在每个节点，随机选取所有特征的一个子集，用来计算最佳的分割方式。

优点

能够处理高维(即特征很多)的数据，并且不用进行特征选择，是随机选择的。
训练结束后，能够给出哪些特征比较重要。
模型的泛化能力较强。
训练速度快，容易做成并行化方法，训练时树与树之间是相互独立的。
在训练过程中，能够检测到特征间的相互影响。
对于不平衡的数据集来说，可以平衡误差。
具有鲁棒性，即使有特征遗失，仍可以维持准确度。

缺点

在噪音较大的分类或回归问题上会出现过拟合。
对于有不同取值的属性的数据，取值划分较多的属性会对随机森林产生很大的影响，因此随机森林在这种数据上产生的属性权值是不可信的。

SVM

目的

支持向量机是一种经典的二分类模型，基本模型定义为特征空间中最大间隔的线性分类器，其学习的优化目标就是间隔最大化，即基于训练集D在样本空间中找到一个划分超平面，将不同类别的样本分开。当超平面的距离与它最近的数据点的间隔越大，分类的鲁棒性就越好，于是当新的数据点加入时，超平面对这些点的适应性越强，出错的可能性就越大。

优点

非线性间隔映射是SVM方法的理论基础，SVM利用内积核函数代替向高维空间的非线性映射。
SVM的目标是找到对特征空间划分的最优超平面，SVM方法的核心是最大化分类边际的思想。

猜你喜欢

转载自blog.csdn.net/u012325865/article/details/103860274

RDKit | 基于RF和SVM的溶解度预测模型比较

RDKit：基于RDKit的溶解度预测的机器学习模型

DGL & RDKit|基于GCN与基于3D描述符的分子溶解度预测模型对比

RDKit | 基于RDKit绘制化学反应

RDKit | 基于RDKit和SMARTS的化学反应处理

RDKit | 基于RDKit去除片段（盐或络合物等）

RDKit | 基于分子形状的比对

RDKit | 基于RDKit和scikit-learn的KNN模型预测Ames的致突变性

基于Pytorch和RDKit建立QSAR模型

RDKit | 基于随机森林（RF）的机器学习模型预测hERG阻断剂活性

RDKit：基于RECAP生成片段

RDKit | 基于PCA探索化学空间

RDKit | 子结构搜索和MCS算法

RDKit | 基于RDKit描述三维分子形状（3D描述符）

RDKit | 基于RDKit输出分子结构图（Image）的方法

RDKit | 基于RDKit通过SMARTS定义反应模式来生成反应产物

RDKit | 基于RDKit处理化学信息学中的反应方程式

RDKit | 基于不同描述符和指纹的机器学习模型预测logP

RDKit | 天然产物的相似度评分(NP-likeness)

基于RDKit的Python脚本：SDF格式转SMILES格式

RDKit：基于分子文件输出分子结构

RDKit：化合物骨架分析（基于Python3）

RDKit | 基于分子指纹的相似性图

RDKit | 基于Lipinski规则过滤化合物库

RDKit | 基于分子指纹可视化化学空间

RDKit | 基于相似图可视化原子贡献

RDKit | 基于keras的化合物SeqToSeq Autoencoder

RDKit：运用RDKit计算USRCAT

RDKit | 化合物芳香度分子描述符的计算与相关性比较

RDKit | RDKit 中的RECAP进行分子裂解

今日推荐

技术解析 GPT-4o：即时语音交互的突破与 GenAI 发展策略

开源大模型与闭源大模型

微信小程序授权登录获取用户的openid

亿级流量系统架构设计与实战

人工智能时代的程序设计教学与课程设计

纽交所技术问题致伯克希尔 (BRK.A) 显示跌近 100%

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

周排行

tensorflow 笔记：二（北大）

fork函数详解

unity单利模板

mac下的特殊键位指引（转自apple）

c语言入门-注释

Python--多任务[线程，进程，协程]

深度对抗学习在图像分割和超分辨率中的应用

【转】【Maven】Project configuration is not up-to-date with pom.xml错误解决方法

基本数据类型与常量池

部署自己的Intell项目的经历

每日归档

更多

2024-06-07(0)

2024-06-06(0)

2024-06-05(0)

2024-06-04(10)

2024-06-03(52)

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)