机器学习笔记 - Kaggle竞赛 基于SMAPE评估指标的TensorFlow决策森林预测帕金森病进展

一、概述

        比赛提供的AMP®-帕金森病进展预测数据集上的TensorFlow决策森林来训练基线随机森林模型。该模型必须预测MDS-UPDR评分,该评分衡量帕金森病患者的进展情况。

        大致上,代码如下所示:

import tensorflow_decision_forests as tfdf
import pandas as pd

dataset = pd.read_csv("project/dataset.csv")
tf_dataset = tfdf.keras.pd_dataframe_to_tf_dataset(dataset, label="my_label")

model = tfdf.keras.RandomForestModel()
model.fit(tf_dataset)

print(model.summary())

        这里首先将对数据进行一些预处理,使ML模型更容易从中学习。然后了解如何实现和使用本次比赛中使用的评估指标:SMAPE。

        决策森林是一个基于树的模型家族,包括随机森林和梯度提升树。在处理表格数据时,它们是比较好的起点,可以提供一个基线,以供下一步基于神经网络进行预测参考之用。

        数据集下载

链接:https://pan.baidu.com/s/17plsPzFR4fbA-9e_vgl81g?pwd=4655 
提取码:4655

二、参考代码

1、导入需要的包

import tensorflow as tf
import tensorflow_decision_forests as tfdf
impor

猜你喜欢

转载自blog.csdn.net/bashendixie5/article/details/130897366
今日推荐