版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/u010255642/article/details/82930045
在http://archive.ics.uci.edu/ml/datasets/wine+quality找到葡萄酒质量数据集(Wine Quality Dataset ),它涉及根据每种葡萄酒的化学度量值来预测白葡萄酒的质量。
11个输入变量和一个输出变量。变量名如下:
非挥发性酸度
挥发性酸度
柠檬酸
残留糖
氯化物
游离二氧化硫
总二氧化硫
浓度
pH值
硫酸盐
酒精度
质量(得分在 0 和 10 之间)
首先,上传数据到OBS桶:
先创建一个文件夹,把数据传入。
在此,仅以白葡萄酒为例子,将数据文件分割好,大部分是训练数据,一部分是测试数据,不允许重复。
专属版
通过 MRS 将数据导入 HDFS
步骤1 单击“服务列表”,选择“EI企业智能 > MapReduce服务”。
步骤2 在左侧导航栏中,选择“集群列表>现有集群”。
步骤3 选择集群“mrs-mls”,选择“文件管理”分页,单击“导入数据”。
步骤4 在弹出框中,选择表2-4中的路径。
表 2-4 导入路径
步骤5 单击“确定”,等待页面提示导入成功。
下面创建一个机器学习项目