数据科学比赛汇总kaggle阿里天池等以及一般流程分享

目前我了解到的数据科学比赛有如下:
kaggle
阿里天池
DataCastle
FlyAI
Datafountain
Biendata
AI Challanger
Kesci
JDATA
iFLYTEK
这些比赛一般都是给你数据集,大致流程为:
1.对数据进行一些数据预处理,特征工程
2.读取数据,然后可以看看数据是否读取成功
3.如果是使用的pytorch,要定义dataset与dataloader,这两个的区别是
Dataset就是通过单个样本索引
而dataloader可以通过一个batch来读取。

4.建立你的模型,使用一些预训练模型,还有比如自己搭一些卷积神经网络,对于图数据还可以构建图神经网络
5.建立迭代,前向传播,自动反向传播(如果要做预测,对于训练数据和测试数据分别做各自的迭代,不过测试数据集不需要反向传播)
6.submit或者predict得到准确率或者预测的结果

后面如果想到,还会不断对本文更新

猜你喜欢

转载自blog.csdn.net/csphillip/article/details/106327073