2023华数杯数学建模C题完整论文,包括每个问题的代码

目录

 

摘要

2.1 问题 1 的问题分析

2.2 问题 2 的问题分析

2.3 问题 3 的问题分析

完成版论文见此


                摘要

问题一,我们使用了390名3至12个月婴儿及其母亲的相关数据,探讨了母亲的
身体和心理指标对婴儿的行为特征和睡眠质量的影响。我们首先进行了描述性统计分析,
通过绘制母亲年龄、教育程度、妊娠时间、整晚睡眠时间以及入睡方式等的分布图来了
解数据的概括特征。然后,通过One-Hot编码处理婴儿行为特征和入睡方式,我们使用 随机森林模型来评估母亲的身体指标(如年龄、婚姻状况、教育程度等)和心理指标(如
CBTS、EPDS、HADS等)与婴儿的睡眠质量之间的关系。结果显示,母亲的心理健康
状态确实与婴儿的睡眠质量有显著关联,特别是母亲的抑郁和焦虑症状与婴儿的睡眠质
量负相关。此外,母亲的教育程度和婴儿的入睡方式也与婴儿的睡眠质量有一定关系。
这些发现强调了母亲心理健康对婴儿发展的重要性,也为未来的干预策略提供了依据。
问题二,从数据预处理到特征工程,再到模型的建立与求解。目标是基于给定的特
征预测目标变量。在数据加载与检查阶段,我们加载了数据并进行了基本的检查和概览。
数据预处理阶段包括了对类别变量的编码、处理缺失值以及数据规范化。特征工程阶段
对数值特征进行了缩放以满足模型的需求。模型建立与求解阶段,我们尝试了逻辑回归、
支持向量机、k-最近邻、梯度提升树等基础模型,以及随机森林、Adaboost、XGBoost 等 集成模型,并对随机森林模型进行了 GridSearch 超参数优化。在尝试的多个模型中, 逻辑回归表现最佳,准确率约为 64.10%。我们还通过各种图表和可视化方法深入了解
了数据分布和模型性能。
问题3,主要探讨了如何通过数学建模和优化技术来评估将婴儿的行为特征从矛盾
型改变为中等型或安静型所需的最小治疗费用。首先,我们从提供的数据集中提取了相
关特征。然后,我们使用线性插值模型来建立治疗费用与患病得分(例如CBTS、EPDS
和HADS得分)之间的关系。接下来,我们构建了线性规划模型,以最小化治疗费用,
同时确保达到目标得分,例如中等型或安静型婴儿的平均得分。
问题4首先要对婴儿的睡眠质量进行优、良、中、差四个等级的综合评判。评估基
于三个关键因素:整晚睡眠时间、睡醒次数和入睡方式。整晚睡眠时间以分钟为单位进
行分析,根据不同的时间区间赋予分值。睡醒次数根据醒来的次数赋予分值,反映睡眠
的连续性。入睡方式则根据入睡的舒适度和有效性赋予分值,包括五个级别,如哄睡法、
抚触法等。通过结合这些因素,我们计算了每个样本的总评分,并根据总评分将睡眠质
量分为四个等级。针对处理好的数据进行缺失值处理等手段进行数据完整性的检查,并
进行有序编码。然后,针对数据运用XGBoost进行特征的筛选,删除无用的特征。随 后构建了一个堆叠融合分类模型来预测睡眠质量评级。使用了随机森林、支持向量机和
梯度提升机作为基本分类器,并通过网格搜索找到了最佳参数组合。模型在测试集上的
准确度为91.54%。我们还绘制了各个模型的ROC曲线和混淆矩阵,并使用训练好的模
型对新的特征值进行了预测。

2.1 问题 1 的问题分析


在本研究中,我们关注的问题是母亲的身体和心理指标如何影响婴儿的行为特征和
睡眠质量。通过分析来自390名3至12个月婴儿及其母亲的数据,我们旨在揭示母亲
的年龄、婚姻状况、教育程度、妊娠时间、分娩方式、心理健康状态等与婴儿的睡眠质
量和行为特征之间的潜在关系。
问题分析必须考虑以下几个方面:
(1) 数据理解:我们需要了解数据的结构和内容,包括各种指标的意义和可能的关联,
以确定分析的方向和方法。
(2) 特征处理:由于数据包括数值和分类特征,我们需要考虑如何处理这些特征,例如
使用 One-Hot 编码来转换分类特征。 (3) 模型选择:选择合适的模型是关键。在本案例中,随机森林模型被选为合适的算法,
因为它可以处理复杂的非线性关系,并提供特征重要性的评估。
(4) 结果解释:解释模型的结果,理解母亲的身体和心理状态如何影响婴儿的行为和睡
眠,有助于提供有针对性的干预或支持。
(5) 可视化:通过绘制描述性统计图表和模型结果图,使分析更直观和易于理解。


2.2 问题 2 的问题分析


在本项目中,我们的目标是预测婴儿的行为特征信息。我们有一组特征,包括母亲
的年龄、婚姻状况、教育程度、妊娠时间(周数)、分娩方式以及一些心理健康指标(CBTS、
EPDS、HADS)。我们的任务是基于这些特征建立一个模型,以准确预测婴儿的行为类
型。


2.3 问题 3 的问题分析


在本问题中,我们面临的挑战是评估将婴儿的行为特征从矛盾型改变为中等型或安
静型所需的最小治疗费用。这一问题涉及许多复杂的因素和潜在的关系,需要细致的分
析和精确的建模。以下是问题分析的主要方面:
(1) 数据理解:数据集涵盖了390名3至12个月婴儿及其母亲的相关数据,包括身体
指标、心理指标和婴儿睡眠质量指标等。理解这些变量及其可能的相互作用是构建
有效模型的关键。
(2) 特征工程:选择合适的特征来描述母亲的心理健康状态和婴儿的行为特征是一个重
要的步骤。这可能涉及特征选择、特征转换和可能的特征交互。

(3) 模型选择:由于问题的复杂性,可能需要使用先进的机器学习技术,如梯度提升机、
支持向量机和深度神经网络等,来捕捉复杂的非线性关系。
(4) 费用估计:治疗费用与患病程度的关系可能是非线性的。线性插值方法可以用于在
给定的得分范围内估计治疗费用。
(5) 优化问题:问题的最终目标是找到最小化治疗费用的解决方案,同时确保达到特定
的目标得分。这是一个优化问题,可能涉及线性规划或其他优化技术。
(6) 实际考虑因素:在构建数学模型时,还需要考虑实际的医疗和心理健康因素,确保
解决方案的可行性和实用性。

完成版论文见此

文末名片获取完整论文
 

猜你喜欢

转载自blog.csdn.net/weixin_45499067/article/details/132114245
今日推荐