kaggle窥屏(知乎说入门需要独立完成101和playground比赛)

1.titanic

主要是设计pd的数据处理,使用的是最简单的regression模型,不太明白怎么本地跑代码。

2.digital recognizer

3.我去,原来101说的是playground。

4.房价预测,

可以使用RandomForestRegressor和DecisionTreeRegressor,

对数据前处理:

https://www.kaggle.com/serigne/stacked-regressions-top-4-on-leaderboard/notebook

one-hot ;使正态分布;drop(['some_columns'],axis = 1 )

后面的有些不是很明白,

LabelEncoder和get_dummy不一样

-- NORMAL --

猜你喜欢

转载自blog.csdn.net/yagreenhand/article/details/81706336
今日推荐