2023年「深セン杯」トピック 東方三省を完全ナニー論文解説

質問Aにおける 都市住民の健康に影響を与える要因の分析

心血管疾患、脳血管疾患、糖尿病、悪性腫瘍、慢性閉塞性肺疾患などに代表される慢性非感染性疾患(以下、慢性疾患)は、中国住民の健康を左右する重要な問題となっている。人々のライフスタイルの変化に伴い、慢性疾患の罹患率は増加し続けています。ご存知のとおり、健康状態は年齢、食生活、身体活動、職業などと密接に関係しています。無理のない食事を心がけ、適度な運動をし、健康的な生活習慣を実践することで、健康増進という目的をいかに達成するかは社会共通の課題です。添付資料 A1 は市の健康研究部門が一部の住民を対象に実施した「慢性非感染性疾患とその関連影響因子の疫学」に関する調査票、添付資料 A2 は対応する調査データ結果である。中国居住者のための改訂された食事ガイドライン。

全体的な表示図:

私の目次をご覧いただければ、この質問に対する私の解決策の 1 つが非常に明確であることがお分かりいただけると思いますが、これは市販されているさまざまなウォーターペーパーとは異なり、目次ですら論理的ではありません。

以下は論文の概要です。ご覧のとおり、ここの 4 つの第 5 章から第 8 章は、タイトルの 4 つのサブトピックに対応しています。

問1 付録A3を参照しながら、付録A2に示されている住民の食生活の合理性を分析し、主な問題点を説明しなさい。

質問 1 については、付録 2 で住民の食生活と合理性を分析するために添付のサプライヤーを参照し、ここで主な問題点を説明する必要があります。付録 A3 の 8 つの基準を理解することで、付録で関連する指標を抽出できます。このデータは、住民の食生活の合理性を測定するために使用され、その後、各指標について記述的な分析が行われ、住民の食生活と住民の食生活とのギャップを示すグラフを作成します。 「中国居住者のための食事ガイドライン」。下図のように、D4~D37の指標を分類した上で、附属書A3に関わる指標を順次抽出して指標を構築し、構築後にA3とのギャップ分析を行うことができます。

以下は構築後のインジケーターの分布です。正規分布図、バイオリン図、箱ひげ図を組み合わせて表示および分析できます。

分析結果をまとめると、住民の食生活の合理性とガイドラインとのギャップを指摘し、提言することができます。


質問 1 は、コードの実行後に結果を生成します。

質問 2: 住民の生活習慣や食生活が、年齢、性別、婚姻状況、教育レベル、職業などの要因と関連しているかどうかを分析します。

解決策 1: 相関分析。生活習慣指標と食生活指標の関連変数を整理し、年齢、性別、婚姻状況、学歴、職業などの要素ごとに相関分析を行い、その結果を分析する前回の相関分析の相関係数を積分してその相関係数の平均値を求め、全体と上記の要素との間に相関があるかどうか、また個別にどの変数が相関が低いか、あるいは相関を示さないかを判定します。

解決策 2: ロジスティック回帰では、まず生活習慣や食生活の指標に関する変数を整理し、これらの変数を X として、次に年齢、性別、婚姻状況、学歴、職業、他の人口統計的要因が Y として使用されます。たとえば、性別を Y の例として取り上げ、まずその F 検定が有意であるかどうかを分析し、有意な場合は全体として影響関係があることを示し、次に標準化された各項目の回帰係数を調べて個々の有意関係を確認します。

解決策 3: 機械学習 + モデル解釈 (形状モデル)、方法 2 と同じ。最初に指標を確認し、次に機械学習を使用して分類モデルまたは回帰モデルをモデル化し、そのモデルを形状モデルに入力して、各指標を決定できるようにします。非線形の観点から見た人口動態要因への影響 (Y)

ここでは、2 番目の質問には解決策 2 を使用します。3 番目の質問では解決策 3 を使用するため、より多くの選択肢が得られます。質問 2 の論文は次のとおりであり、解決策 2 の説明とは異なります。ここでは PCA を使用しました。分類された指標が 380 以上の指標に達したため、次元削減を行います もちろん、次元削減は直接の次元削減ではありません 私の論文は次元削減のために 4 つの部分に分かれており、その説明可能性が順番に分析されます。
質問 2 は、コードの実行後に結果を生成します。

問 3 付録 A2 のデータに基づいて、一般的な慢性疾患(高血圧、糖尿病など)と、喫煙、飲酒、食習慣、生活習慣、仕事の性質、運動などの要因との関係や程度を深く分析してください。

この質問は質問 2 と同じです。唯一の違いは、Y を変更することです。Y は (0: 病気なし、1: 高血圧または糖尿病)、次にこれらの変数を並べ替えます。質問 2 を使用することができます。解決策 3 を解いてから、問題 2 と同じ解決策を適用すると、問題 3 を解く難易度が下がります。自分のスキルを誇示したい場合は、別の機械学習を使用して比較することができます。ここでは、xgboost+shap モデルを使用します。
質問 3 は、コードの実行後に結果を生成します。

質問 4 付録 A2 の住民の具体的な状況に従って、住民を合理的に分類し、さまざまな人々のグループに対して健康的な食事と運動について合理的な提案を提案してください。

この質問の核心は分類の方向性であり、質問の観点から見ると、病気(高血圧や糖尿病)の有無による分類や、人口統計上の特徴による分類など、さまざまな種類があります。青少年、若者、中年、高齢者、肥満のグループや食生活など、実際にはさまざまな方法がありますが、それらは切り離せないものです。この分析は、最初の質問の分析を直接コピーできますが、今回は母集団に応じて分割されています。

ここでは、まず k クラスター分析に基づいて居住者の人口属性を分類し、エルボー ルールにより居住者を 3 つのタイプの顧客グループに分類することを決定します。カテゴリー 1 は主に若年層と中高年層であり、男女比が同程度、高学歴、婚姻状況は未婚と既婚が主であるなど。カテゴリー 2 は主に中高年女性であり、平均的な教育レベル、主に既婚者など 次に、分類ラベルをフィルター条件として使用して、3 つの顧客グループに分割します。食生活や合理的な分析方法は第5章と同様で、各グループの問題点を列挙した上でガイドラインと組み合わせる。健康に役立つ食事と運動の提案


質問 4 は、コードの実行後に結果を生成します。

完全なビデオと完成品は Bilibili で入手できます。

2023 東北三省深セン杯のトピック 論文完成 都市住民の健康に関する乳母チュートリアル分析_哔哩哔哩_bilibili

おすすめ

転載: blog.csdn.net/weixin_44099072/article/details/132018094