一、概述
比赛提供的AMP®-帕金森病进展预测数据集上的TensorFlow决策森林来训练基线随机森林模型。该模型必须预测MDS-UPDR评分,该评分衡量帕金森病患者的进展情况。
大致上,代码如下所示:
import tensorflow_decision_forests as tfdf
import pandas as pd
dataset = pd.read_csv("project/dataset.csv")
tf_dataset = tfdf.keras.pd_dataframe_to_tf_dataset(dataset, label="my_label")
model = tfdf.keras.RandomForestModel()
model.fit(tf_dataset)
print(model.summary())
这里首先将对数据进行一些预处理,使ML模型更容易从中学习。然后了解如何实现和使用本次比赛中使用的评估指标:SMAPE。
决策森林是一个基于树的模型家族,包括随机森林和梯度提升树。在处理表格数据时,它们是比较好的起点,可以提供一个基线,以供下一步基于神经网络进行预测参考之用。
数据集下载
链接:https://pan.baidu.com/s/17plsPzFR4fbA-9e_vgl81g?pwd=4655
提取码:4655
二、参考代码
1、导入需要的包
import tensorflow as tf
import tensorflow_decision_forests as tfdf
impor