kaggle平台的配置与使用

Kaggle是由联合创始人、首席执行官安东尼·高德布卢姆(Anthony Goldbloom)2010年在墨尔本创立的,主要为开发商和数据科学家提供举办机器学习竞赛、托管数据库、编写和分享代码的平台。很多数据样本可以从该平台获取。类似于Githup.

想获取上面的数据则需要一个账号。

目前只支持Facebook gmail 雅虎账号直接授权登录。

由于某些原因,账号登录时认证需要使用vpn。个人习惯直接使用gmail授权登录。恰好谷歌访问助手可以直接访问gmail.这种方式比赛风3FQ靠谱多了,不会总是掉线。

反正授权登录是没有问题的,想去看墙外其他精彩的世界,还是用vpn哦,小老弟。

使用kaggle实现数据集的下载:

1.在用户头像处点击 My Account,进入用户中心,若当前设备未安装kaggle库,则需要安装 pip install kaggle

2.在 C:\Users\asaxh\.kaggle 找到.kaggle文件夹。如果没有这个文件夹,可以在命令行中输入 kaggle competitions list

待其报错后,去刷新当前目录,则能看到文件夹了。

3.去个人中心my account 下最下面生成一个授权的json文件,授权认证需要它,将该文件拷贝之.kaggle中。

再次执行 kaggle competitions list 就能看到列表数据了。

4.去下载数据集,就是页面中提供好的URL地址,直接在命令行执行就能下载了。

比如获取如下页面数据:https://www.kaggle.com/c/instacart-market-basket-analysis/data

碰到的问题:forbidden 403

新账号授权登录问题,用gmail登录kaggle,被要求验证手机号码,手机号码正常填写后,无法收到验证码。

查询后才明白要手动在前面补860,才能是国内的手机号,太low了。浙江嘉兴的服务商提供的验证码,呵呵

手机账号认证后,还需要同意规则。否则一直都是403错误。

猜你喜欢

转载自www.cnblogs.com/wen-kang/p/11031522.html
今日推荐