以下是可供公众免费使用的数据集列表:
- Kaggle 数据集:https://www.kaggle.com/datasets
- UCI机器学习库:https://archive.ics.uci.edu/ml/index.php
- AWS 的数据集:https://registry.opendata.aws/
- Google 数据集搜索引擎:https://toolbox.google.com/datasetsearch
- 微软数据集:https://msropendata.com/
- Awesome 数据集:https://github.com/awesomedata/awesome-public-datasets
- 计算机视觉数据集:https://www.visualdata.io/
- Scikit-learn 数据集:https://scikit-learn.org/stable/datasets/index.html
以上的数据集是可以下载的,这些数据一般是用来学习,比赛,在实际的工作中一般是用不到的,需要使用爬虫技术去爬虫,整理。