大数据之路、阿里巴巴大数据实践读书笔记 --- 第七章、数据挖掘

一、阿里巴巴算法平台框架和原理

  • 算法平台计算框架MaxCompute  MPI;

  • 伏羲为阿里云飞天系统的分布式调度系统;

  • 女娲为阿里云飞天系统的分布式一致性协同服务;

  • 盘古为阿里云飞天喜听的分布式文件存储系统;

基于MaxCompute MPI,目前阿里巴巴的算法平台已经继承了攫夺大多数业界主流的机器学习算法

  • 分类

    • LogisticRegression

    • KNN

    • GBDT

    • DTC5.0

    • RandomForest

    • linearSVM

    • nonlinearSVM

    • NavieBayes

    • Bayes

    • Fisher判别

    • 马氏距离判断

    • 标签传播分裂

  • 回归算

猜你喜欢

转载自blog.csdn.net/u012965373/article/details/105231876