最も完全なデータ パッケージ + 実行可能コード + モデル構築 + 43 ページの PDF フルバージョンの思考統合 (2023 年明星春季大会の Y の質問)。線形 SVM、最適化されたハイパーパラメータを持つ SVM、最適化された決定木、アンサンブル学習ブースティング ツリー、最適化されたアンサンブル学習モデルを選択します。

2023 年米国大会 Y の質問は次のとおりです。

1.トピック分析:まず、中古ヨット分野の専門性により、関連するデータ情報を取得することは困難です.中古分野の他の製品の価格原則を参照できます(中古車、中古住宅) およびモデリングのアイデアを構築するためのその他の情報。次に、データの前処理に関して、欠損値を処理するための一般的な方法には、最近傍アルゴリズム、ラグランジュ補間処理、3 次畳み込みなどがあります。

 

2. 思考分析: 価格モデルは過去の全国大会に登場しており、思考の参考にすることができます。この質問の難易度は比較的高いです. コアは中古ヨットの価格モデルを構築することです. 最初のステップでは, 中古ヨットの分野でより多くのウェブサイトを集めることができます. 2番目のステップでは, 使用しますデータをクロールするタコなどのクローラー技術. 3番目のステップでは、モデルを構築し、価格は他のデータ情報との関係を確立します.

3. 考慮すべきもう 1 つのこと: カテゴリ データと連続データの間の関係モデルを確立する方法は? カイ 2 乗検定は 2 つのカテゴリ変数間の関係に使用でき、カテゴリ データと連続データの関係は、分散分析または T 検定によって分析して、連続データとカテゴリ データの関係を見つけることができます。最初の 2 つの質問では、カテゴリ データと連続データの間の関係を確立する必要があるため、分析に同じ方法を使用しないようにしてください。

 

質問 3 . 特定の地域のモデリングが香港 (SAR) 市場でどのように機能するかについて話し合います。提供されたスプレッドシートから有益なヨットのサブセットを選択し、モノハルとカタマランに分類します。このサブセットの比較可能な上場価格データは、香港 (SAR) 市場から見つかりました。サブセット内のヨットのヨット 1 隻あたりの価格に対する香港 (SAR) の地域的影響 (存在する場合) をモデル化します。カタマランはモノハルと同じ影響を与えますか?

質問 3、質問 3 は、質問 1 および 2 とは異なります。質問 3 では、香港の地理的エリアについて別の価格評価を行う必要があり、カタマランとモノハルへの影響が同じかどうかも判断する必要があります。したがって、質問 1 と 2 のモデルを引き続き使用できます。たとえば、回帰分析モデルを使用する場合、地域指標の影響を提案し、分析のために香港の他の関連データ特性を選択する必要があります。

データにも注目すべき点があります.Yの質問全体について、彼の結果はかなりオープンであることがわかります. 私たちは通常、この種のオープンな結果を持つ質問が好きです。その理由は、この種の質問では、合理的である限り、彼の答えは固定値であってはならないからです。合理的であることが保証されている場合は、文献をざっと読んで現状を把握する必要があり、結果が法外でない限り、審査員は私たちの論文を直接的に間違っていると判断することはできません。したがって、実際にデータを見つけることができない場合、または見つけたデータが良くなく、コード プログラミングの結果が理想的でない場合、この種のオープンな結果トピックについては、データ セットを作成するか、データ セットを作成する必要があります。合理的な結果 理解できます。

 

質問 4 . チームがデータから引き出すその他の興味深く有益な推論または結論を特定して議論します。

この種の比較的新しいトピックは詳細に関するものです。質問、興味深い結論、および情報も最終レビューに不可欠であるため、全員が常に注意を払う必要があります。アメリカ大会の審査はなんといっても7点満点制なので、自分の結論が魅力的になればレベルアップも可能です。したがって、質問 4 については、常に最初からデータ処理に注意を払い、いくつかの興味深い点を見つけて、どれが審査員を感動させるか分からないことをお勧めします。たとえば、与えられたデータの最高取引価格は常に特定の場所に表示され、最低価格は常にまあまあです。これは本当に天才のショーです。

質問 5.香港 (SAR) のセーリング ブローカー向けに 1 ~ 2 ページのレポートを作成します。ブローカーがあなたの結論を理解できるように、厳選されたチャートをいくつか含めてください。

 

質問 5 は、一般的な数値シミュレーションの質問です。私たちは通常、それらを非技術記事と呼んでおり、誰もが自分の才能を示す必要があります。質問の設定では、いくつかの図を含めることができることを明確に思い出させます. したがって、いくつかのプロジェクト提案などの例に従って、非技術的な記事を書くことができます。

まとめ:問Zの総合難易度に比べて、問Yの総合難易度は、全米大会の今春の大会で最も難しい出題になるはずです。ただ、このテーマの全体的な難易度は、デジタルとアナログの分野全体で中程度の難易度だと思いますので、あまりプレッシャーをかけずに頑張ってください。

おすすめ

転載: blog.csdn.net/ZHAIOJK/article/details/129886075