1.titanic
主要是设计pd的数据处理,使用的是最简单的regression模型,不太明白怎么本地跑代码。
2.digital recognizer
3.我去,原来101说的是playground。
4.房价预测,
可以使用RandomForestRegressor和DecisionTreeRegressor,
对数据前处理:
https://www.kaggle.com/serigne/stacked-regressions-top-4-on-leaderboard/notebook
one-hot ;使正态分布;drop(['some_columns'],axis = 1 )
后面的有些不是很明白,
LabelEncoder和get_dummy不一样
-- NORMAL --