[每日问答]ID3,C4.5,CART的区别是什么?

ID3:根据“最大信息增益”原则选择划分当前数据集最好的特征,按照特征的所有取值进行划分。一旦按照某种特征进行切分后,该特征在之后的计算中就不再起作用。
C4.5:ID3的划分原则有个缺点,它一般会选择属性值较多的特征,C4.5使用“信息增益率”来作为特征切分的准则,同时C4.5还弥补了ID3不能处理特征属性值连续的问题。
CART:它是一棵树,采用二元切分法将数据切成两份分别进入左子树和右子树,采用Gini系数作为切分标准,主要反映切分后数据的不纯度。回归树采用方差缩减作为切分标准。

猜你喜欢

转载自blog.csdn.net/cloud_xiaobai/article/details/72871692