用Python搞机器学习、数据科学,需要很多相关的资料,各种库、工具,都是常用、常找、常查的内容。
最近,维也纳的数据科学家Florian Rohrer把这类相关资料整理成了一个Python机器学习工具合辑,可以照着更新一下自己的收藏夹了。
四十几类项目
整个列表中,包含超过40类内容:
核心工具、Pandas和Jupyter、文本提取、大数据、统计、特征提取、可视化、地理工具、推荐系统、决策树、NLP、CV、神经网络、GPU、聚类、机器学习可解释性、强化学习……
具体都有什么呢?比如第一部分核心工具:
pandas、scikit-learn这些常用的库都有,直接链接到它们的GitHub或者官网页面。
再比如说可视化部分:
包括可以生成3D效果图的physt:
做各种统计图表的Yellowbrick:
这哪怕是做PPT,都非常有用啊!
资源列表大集结
另外,项目贡献者还安利了几个GitHub上不错的资源列表:
大部分都是几百几千星的资源表,也有不少标星数万的经典内容,比如awesome-machine-learning:
各种语言项目都有,是真的awesome。
常用代码
最后,还有一个部分是“经常Google的内容”。
可能对大家有用的代码:
传送门
最后,送上资源传送门:
https://github.com/r0f1/datascience
我自己是一名高级python开发工程师,这里有我自己整理了一套最新的python系统学习教程,包括从基础的python脚本到web开发、爬虫、数据分析、数据可视化、机器学习等。送给正在学习python的小伙伴!我们的python学习交流q–u–n【 784758214 】,这里是python学习者聚集地,欢迎初学和进阶中的小伙伴!
点击:加入