中文资源
图书
入门类
《写给程序员的数据挖掘实践指南》 – Ron Zacharski
《统计学习方法》-李航
《机器学习》 – 周志华 重点推荐
《机器学习实战》
《统计学习基础》
数据集
UCI机器学习库——350多个可检索数据集,几乎涵盖每一个主题。
http://archive.ics.uci.edu/ml/index.php
Kaggle数据集——Kaggle社区上的100多个数据集。
https://www.kaggle.com/
Data.gov——由美国政府发布的开放数据集。
https://www.data.gov/
金融数据集
Quandl——数据市场,提供免费的金融和经济数据。
https://www.quandl.com/
Quantopian——定量金融社区,开发交易算法提供了一个免费的平台。
美国基础档案文件——5000多家美国公司5年的基本数据。
http://www.usfundamentals.com/download/
比赛
Kaggle比赛
https://www.kaggle.com/
自然语言处理
“结巴”中文分词:做最好的 Python 中文分词组件
https://github.com/fxsjy/jieba
英文资源
Books
《An Introduction to Statistical Learning with Application in R》
《Elements of Statistical learning》
https://web.stanford.edu/~hastie/Papers/ESLII.pdf
机器学习python类库速查表
Essential Cheat Sheets for deep learning and machine learning researchers
- Keras
- Neural Networks Zoo
- Numpy
- Scipy
- Pandas
- Scikit-learn
- Matplotlib
- Deep Learning Cheat Sheet
https://github.com/kailashahirwar/cheatsheets-ai
数据资源
Kaggle
https://www.kaggle.com/
视频
吴恩达在Coursera的Machine Learning视频
吴恩达在Coursera的Deep Learning视频
李飞飞在斯坦福的Convolutional Neural Network视频(CS231n)
Geoffrey Hinton 在 Coursera上面的Deep Learning视频
一些有用的短视频
Backpropagation in 5 minutes.
https://www.youtube.com/watch?v=q555kfIFUCM
其他
论文笔记,帮助理解论文
http://www.shortscience.org/