特征组合
目的:
- 主要是为了简化非线性问题,将其简化为线性问题,便于理解分析。
概念:
- 特征组合是指通过将两个或多个输入特征相乘来对特征空间中的非线性规律进行编码的合成特征。
区分:
分箱:指的是一种将区间用01来表示的方式,这样大大简化了解决问题的复杂度,毕竟对于比较细的浮点数精度,相差很小的话他们预测结果差别很小,所以我们将某个特定区间(他们预测结果大致一致)作为一个整体形成特征的一部分。
实值:表示实际的值,比如纬度37.4, 37.5这样很具体的值。
分箱:指的是一种将区间用01来表示的方式,这样大大简化了解决问题的复杂度,毕竟对于比较细的浮点数精度,相差很小的话他们预测结果差别很小,所以我们将某个特定区间(他们预测结果大致一致)作为一个整体形成特征的一部分。
实值:表示实际的值,比如纬度37.4, 37.5这样很具体的值。