2023 Huashu Cup 数学モデリング C 問題全 5 問 コード アイデア分析

現時点で、全 5 つの質問の完全なコードと 42 ページの論文 (本文 30 ページと論文部分の要約) は次のとおりです。

この論文では、乳児の行動特性、睡眠の質、母親の身体的および心理的指標との関係、および乳児の行動特性と睡眠の質を最適化する方法について、合計 5 つの問題を取り上げます。

質問 1 では、データを前処理し、乳児の行動特性データを処理して数値データに変換し、ピアソン相関係数を使用して、母親の身体的および心理的指標と乳児の行動特性および睡眠の質との関係を調べました。間の関係。

質問 2 では、乳児の行動特性を、静か、穏やか、両義的な 3 つのタイプに分類しました。乳児の行動特性と母親の身体的および心理的指標との間の関係モデルを確立するために、ロジスティック回帰、サポートベクターマシン、デシジョンツリー、ランダムフォレスト、XGBoostモデルなどのさまざまな分類モデルを確立しました。次に、これらのモデルを使用して、データ テーブル内の乳児の最後の 20 グループ (番号 391 ~ 410) の行動特性を判断し、行動特性が削除された乳児のタイプを予測しました。予測結果は、次のことを示しています。

質問 3 では、提供されたデータを使用して治療費とスコアの減少との間の線形モデルを確立し、現在の行動特性が曖昧な乳児 (番号 238) の最大治療費を計算しました。次に、2 番目の質問で確立された XGBoost 分類モデルを使用して、さまざまな CBTS、EPDS、および HADS スコアの下での乳児の行動特性を予測し、治療コストを最小限に抑えるスコア削減スキームを見つけます。解の結果は、行動特性を中型に変えるための最小治療コスト: 、調整計画: 、行動特性を静か型にするための最小治療コスト: 、調整計画: … となります。

質問4では、エントロピー重み付け法に基づくTOPSIS総合評価手法を使用して赤ちゃんの睡眠の質を分類および評価し、エントロピー重み付け法を使用して指標重みを決定し、専門家のエンパワーメントによってもたらされる主観性を回避し、データの標準化とデータの標準化を使用します。スコアリング モデルを構築するための転送メソッド。次に、評価結果を使用して回帰モデルを確立し、総合的な睡眠の質の評価を予測しました。質問 5 では、質問 3 に基づいて、赤ちゃんの睡眠の質の評価を優れたものに調整し、睡眠の質を再予測しました。解決策の結果: 睡眠の質を 4.0 (優れた) にするための最小治療費: ......、調整計画: ...

総合すると、この研究は、母子関係を理解し​​、乳児の行動特性と睡眠の質を最適化するための重要な洞察と解決策を提供します。

5 つの質問すべてのコードは次のとおりです。

1. 問題の再説明... 4

2. 問題分析... 5

2.1 問題 1...5 の分析

2.2 問題 2...6 の分析

2.3 質問 3 の分析...6

2.4 質問 4...6 の分析

2.5 質問 5...6 の分析

3. モデルの仮定... 7

4. 記号の説明…7

V. モデルの確立と解決策... 8

5.1 問題 1 モデルの確立と解決...8

5.1.1 データの前処理... 8

5.1.2 ピアソン相関係数分析...8

5.2 問題 2 モデルの確立と解決...10

5.2.1 論理分類モデルの確立...11

5.2.2 サポートベクターマシン分類モデルの確立...12

5.2.3 デシジョンツリー分類モデルの確立...12

5.2.4 ランダムフォレスト分類モデルの確立...13

5.2.5 XGBoost 分類モデルの確立... 13

5.2.6 予測結果の比較と分析...14

5.3 問題 3 モデルの確立と解決... 15

5.3.1 治療費とスコアの線形モデル... 15

5.3.2 治療費を最小限に抑えるための最適解モデル...16

5.3.3 解決策の結果と治療計画の分析...18

5.4 問題 4 モデルの確立と解決... 19

5.4.1 エントロピー重み法に基づく TOPSIS 評価モデル...19

5.4.2 データ転送... 19

5.4.3 データの標準化... 21

5.4.4 重みを決定するためのエントロピー重み法... 21

5.4.5 スコアリングモデルの構築... 23

5.4.6 睡眠の質の総合評価スコア…24

5.4.7 睡眠の質に関する XGBoost 相関モデルの確立... 24

5.4.8 包括的な睡眠の質の予測結果... 25

5.5 問題 5 モデルの確立と解決...26

5.5.1 睡眠の質調整治療計画... 26

5.5.2 問題 5 の治療戦略... 28

6. モデルの評価とプロモーション... 28

7. 参考文献... 30

VIII. 付録... 31

1. 問題の再説明

2023 年華樹杯モデリング数学コンテストの質問 C:

母親は赤ちゃんの人生において最も重要な人物の 1 人であり、栄養や身体の保護だけでなく、精神的なサポートや安心感も与えてくれます。うつ病、不安、ストレスなど、母親の精神的健康に悪い状態は、赤ちゃんの認知、感情、社会的行動に悪影響を与える可能性があります。母親がストレスを感じると、睡眠に影響を与えるなど、赤ちゃんの身体的および心理的発達に悪影響を及ぼす可能性があります。

付録には、生後 3 か月から 12 か月の乳児 390 人とその母親に関するデータが示されています。データは、年齢、婚姻状況、教育、妊娠期間、出産方法などの母親の身体的指標、および母親の心理的指標である CBTS (パートナーシップ関連心的外傷後ストレス障害アンケート)、EPDS (エディンバラ産後うつ病) など、さまざまな主題をカバーしています。スケール)、HADS(病院不安およびうつ病スケール)、および夜間の睡眠時間、目覚めの回数、入眠パターンを含む乳児の睡眠の質の指標。

関連する文献を参照し、専門的背景を理解し、トピックのデータに基づいて数理モデルを構築し、次の質問に答えてください。

1. 母親の身体的および心理的指標が赤ちゃんの行動特性や睡眠の質に影響を与えることは多くの研究で示されていますが、そのような法則はありますか? 添付ファイルのデータに基づいて調査してください。

2. 乳児行動アンケートは、乳児の行動特性を評価するために使用される尺度であり、乳児の感情や反応に関する多くの質問が含まれています。乳児の行動特性を「静か」「穏健」「両義的」の3つのタイプに分類します。赤ちゃんの行動特性と母親の身体的および心理的指標との間の関係モデルを確立してください。

データ表の最後の20グループの乳児(No.391~410)は行動特性情報が削除されていますので、どのタイプに属するかを判断してください。

3. 母親の不安に対する介入は、母親の精神的健康を改善し、母子相互作用の質を改善し、乳児の認知的、感情的、社会的発達を促進するのに役立ちます。CBTS、EPDS、HADSの病気の程度に対する治療費の変化率は治療費に比例するため、調査した結果、2つのスコアに対応する治療費が表1のように求められます。行動特性が曖昧な238番の乳児がいる。赤ちゃんの行動特性を矛盾したものから中程度に変えるのにどれくらいの治療費が必要かを分析するモデルを構築してください。彼の行動プロフィールをより静かなタイプに変えるには、治療計画をどのように調整する必要があるでしょうか?

4. 赤ちゃんの睡眠の質の指標には、一晩の睡眠時間、起きた回数、眠りにつく方法が含まれます。赤ちゃんの睡眠の質を優れ、良い、普通、悪いの4つのカテゴリーで総合的に評価し、赤ちゃんの総合的な睡眠の質と母親の身体的・心理的指標との相関モデルを確立し、最後の20グループ(いいえ)を予測してください。 . 391-410)赤ちゃんの総合的な睡眠の質。

5. 質問 3 に基づいて、赤ちゃん No.238 の睡眠の質を優れていると評価させる必要がある場合、質問 3 の治療戦略を調整する必要がありますか? 調整方法は?

2. 問題分析

2.1 問題点 1 の分析

質問 1: 乳児の行動特性と睡眠の質に対する母親の身体的および心理的指標の影響を分析すること。これは相関分析の問題です。まず、データのクリーニングや変換などの前処理が行われます。次に、ピアソン相関係数を使用して、母親の身体的および心理的指標と乳児の行動特性および睡眠の質の間の相関関係を測定しました。

方法:ピアソン相関係数分析

import numpy as np
from scipy.stats import pearsonr, spearmanr
import statsmodels.api as sm
import seaborn as sns
import matplotlib.pyplot as plt

# 设置中文字体
plt.rcParams['font.sans-serif'] = ['SimHei']
# 设置负数的符号
plt.rcParams['axes.unicode_minus'] = False

# 建立新的变量,取data的前391行数据
data_analysis = data.head(391)

# 进行皮尔逊相关系数分析
correlation_matrix = data_analysis.corr(method='pearson')
print(correlation_matrix)

# 可视化绘图
plt.figure(figsize=(10, 8))
sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm', linewidths=0.5)
plt.title('Pearson Correlation Heatmap')
plt.show()

2.2 問題点 2 の分析

質問 2: 乳児の行動特性と母親の身体的および心理的指標との間の関係モデルを確立します。これは多重分類の問題です。分類モデルを確立することにより、乳児の行動特性は、静か、穏健、矛盾の 3 つのタイプに分類されました。

方法: さまざまな分類モデル (デシジョン ツリー、ランダム フォレスト、XGBoost など) を使用してモデルを構築し、乳児の行動特性を分類して予測します。

コードの一部は次のとおりです。

# 选择母亲的身体指标和心理指标,以及婴儿的行为特征作为数据分析的子集
subset_columns = ['EPDS', 'HADS', 'CBTS', '母亲年龄', '婚姻状况', '教育程度', '妊娠时间(周数)', '分娩方式', '婴儿行为特征']
data_analysis = data.loc[:, subset_columns]

# 划分训练集和测试集,其中删除的婴儿信息为测试集
train_data = data_analysis.loc[1:390, :]
test_data = data_analysis.loc[391:411, :]

# 将婴儿的行为特征作为目标变量
y_train = train_data['婴儿行为特征']
y_test = test_data['婴儿行为特征']

# 将母亲的身体指标和心理指标作为特征变量
X_train = train_data[['EPDS', 'HADS', 'CBTS', '母亲年龄', '婚姻状况', '教育程度', '妊娠时间(周数)', '分娩方式']]
X_test = test_data[['EPDS', 'HADS', 'CBTS', '母亲年龄', '婚姻状况', '教育程度', '妊娠时间(周数)', '分娩方式']]

2.3 質問 3 の分析

質問 3: 乳児の行動特性を矛盾から中程度に変えるための治療の最小コストを分析するモデルを確立し、乳児の行動特性を静かに変えるために治療計画を調整する方法を教えてください。

方法: まず、現在の行動特性が矛盾している乳児の最大治療費を計算する必要があります (No. 238)。次に、2 番目の質問で確立された XGBoost 分類モデルを使用して、さまざまな CBTS、EPDS、および HADS スコアの下での乳児の行動特性を予測し、治療コストを最小限に抑えるスコア削減スキームを見つけます。

2.4 質問 4 の分析

質問 4: 赤ちゃんの睡眠の質を優れ、良い、普通、悪いの 4 つのカテゴリーで総合的に評価し、赤ちゃんの総合的な睡眠の質と母親の身体的および心理的指標との相関モデルを確立し、総合的な睡眠を予測します。最後の 20 グループの赤ちゃんの質。

方法:TOPSIS法を用いて乳児の睡眠の質を分類する総合評価を行った。次に、XGBoost 回帰モデルが確立され、母親の身体的および心理的指標が特徴として使用され、赤ちゃんの包括的な睡眠の質の評価が回帰分析のターゲット変数として使用されました。

2.5 質問 5 の分析

質問 5: 質問 3 に基づいて、赤ちゃんの睡眠の質の評価が優れているように調整し、モデルを再確立して、最後の 20 グループの赤ちゃんの総合的な睡眠の質を予測します。

方法: 質問 3 で得られたモデルに従って、質問 3 の睡眠の質の評価が優れているように調整され、XGBoost 回帰モデルが再確立されました。乳児の最後の 20 コホートの複合睡眠の質評価の予測。

3. モデルの仮定

4. 記号の説明

5. モデルの確立と解決策

5.1 問題 1 モデルの確立と解決

質問 1 では、母親の身体的および心理的指標が乳児の行動特性と睡眠の質に影響を与えるかどうかを調査するためにデータ分析が必要です。このような場合、統計および機械学習技術を使用して相関分析および回帰分析を実行し、指標間の関係を特定できます。次のように進めます。

1. データの前処理: まず、データをクリーンアップして前処理します。これには、欠損値の処理、カテゴリ データの数値データへの変換、データの標準化などの手順が含まれる場合があります。

2. 相関分析: 相関分析を使用して、指標間の相関関係を理解し​​ます。変数間の線形または非線形関係は、ピアソン相関係数またはスピアマン順位相関係数を計算することで測定できます。

3. 回帰分析: 十分なデータが利用可能な場合、回帰分析を使用して、乳児の行動特性および睡眠の質と母親の身体的および心理的指標との関係を予測するモデルを構築できます。多重線形回帰または他の適切な回帰手法を試すことができます。

4. 統計的有意性検定: 回帰分析では、モデルの予測効果が有意であるかどうかを判断するために、モデルに対して統計的有意性検定を実行する必要があります。

5. 結果の解釈:分析結果に従って、母親の身体的および心理的指標が赤ちゃんの行動特性と睡眠の質に及ぼす影響の程度を説明してください。相関関係は因果関係を意味するものではないため、結果は注意して解釈する必要があることに注意することが重要です。

5.1.1 データの前処理

赤ちゃんの行動特性データを加工して数値データに変換する必要があります。

5.1.2 ピアソン相関係数分析

ピアソン相関係数分析は、2 つの変数間の相関関係を理解し​​たい場合に使用できます。これは、2 つの連続変数間の線形相関の程度を測定するために使用される統計手法です。簡単に言えば、ピアソン相関係数は、2 つの変数が正の相関関係にあるのか、負の相関関係にあるのか、またはまったく相関関係がないのかを知ることができます。

ピアソン相関係数の原理は、共分散と標準偏差の概念に基づいています。2 つの変数の共分散の度合いを、共分散を計算することで測定し、その共分散をそれぞれの標準偏差で割ると、2 つの変数間の相関関係を表す -1 ~ 1 の値が得られます。

ドキュメントとコードをダウンロードする方法:

https://mbd.pub/o/bread/mbd-ZJyXkppx

おすすめ

転載: blog.csdn.net/qq_45857113/article/details/132095565