Idées pour le défi de modélisation mathématique 2023mothercup

Prenez d'abord la fosse, j'ai commencé à entrer en contact avec la modélisation mathématique en 2019, et j'ai participé à des dizaines de compétitions de modélisation mathématique, grandes et petites.
Cette Mothercup continuera également d'accompagner la course, proposant des idées de textes gratuits et des idées de vidéos pour tous, ainsi que des codes et des articles de référence dans la suite.

Question A du concours de modélisation mathématique Mathorcup 2023
(mise à jour dès le début du concours)
Question B du concours de modélisation mathématique Mathorcup 2023
(mise à jour dès le début du concours)
Question C du concours de modélisation mathématique Mathorcup 2023
(mise à jour dès le début du concours) le concours commence) (Mise à jour dès que possible)
Question D du concours de modélisation mathématique Mathorcup 2023
(mise à jour dès que le concours commence)

Pièce jointe :
Donnez des idées libres pour la question Y de ce concours américain :
Examinons d'abord la question Y. Le cœur de cette question est de rechercher divers facteurs qui influent sur le prix des voiliers.

Regardons d'abord la première question. Tout d'abord, nous devons préciser que ce type de sujet d'analyse de données n'est rien de plus que la classification, la régression, le regroupement et la détection d'anomalies.Cette question appartient évidemment à la régression. Ensuite, nous devons déterminer l'entrée et la sortie du modèle de régression. L'entrée est ce que nous appelons la variable indépendante et la sortie est la variable dépendante.

Examinons la pièce jointe, et notons que la pièce jointe comporte deux sous-tableaux, correspondant à deux types de voiliers, ce qui signifie que nous devons créer au moins deux modèles. Pourquoi en dire au moins deux, car vous pouvez également construire un modèle pour chaque région. Bien sûr, les principes de ces modèles sont les mêmes. Des caractéristiques telles que la marque, le modèle, la longueur, l'année et la région appartiennent à l'entrée du modèle, et le prix est la sortie du modèle. Si vous estimez que les fonctionnalités fournies dans l'annexe ne suffisent pas et que le titre l'a déjà mentionné, vous pouvez trouver d'autres fonctionnalités par vous-même.

Ensuite, parlons du travail spécifique qui doit être fait dans la modélisation. Nous avons déterminé que cette question est un problème de régression, et les étapes de base d'un problème de régression sont très claires :
encodage -> réduction de dimensionnalité -> régression
n'est rien de plus que ces trois étapes. Certains étudiants peuvent demander pourquoi nous n'avons pas mentionné le nettoyage des données. Ici, nous ne le divisons pas en détails. Les processus dits de prétraitement tels que la normalisation et le nettoyage des données sont tous inclus dans le codage. Ce sont les éléments que vous devez prendre en compte. lors du codage.

Comment l'encoder ? C'est aussi très simple. Nous utilisons un encodage à chaud pour les caractéristiques discrètes telles que la marque et le modèle, et normalisons les caractéristiques continues telles que la longueur et l'année. Une entité telle qu'une région peut être utilisée comme entité discrète pour un encodage à chaud, ou elle peut être convertie en latitude et longitude, ce qui équivaut à une entité continue. Cette question doit utiliser plusieurs entités continues pour représenter la région, sinon le trois questions suivantes ne peuvent pas être faites.

La prochaine étape est la réduction de la dimensionnalité, il n'y a rien à dire ici, l'analyse directe en composantes principales.

Le dernier est de faire une régression. Les modèles de régression courants ne sont rien de plus que des modèles polynomiaux et des modèles d'arbres. Il est recommandé d'utiliser des modèles polynomiaux ici, car le modèle d'arbre équivaut à une boîte noire et vous ne pouvez pas connaître le poids spécifique de chaque caractéristique. La racine de la première question nous oblige à expliquer le prix d'inscription, ce que vous ne pouvez pas expliquer avec un modèle d'arbre.

Voir la deuxième question ci-dessous. La deuxième question est divisée en deux parties. La première consiste à discuter si la région a un impact sur le prix. Cette question peut directement utiliser les résultats de la première question. On peut savoir si elle a suffisamment d'influence sur le prix selon la poids de la caractéristique de la région, et combien elle a.

Ensuite, nous verrons si l'influence de la région est la même pour différents types de voiliers. Ici, nous construisons des modèles de régression pour différents types de voiliers, puis observons si les poids des régions sont les mêmes dans ces modèles de régression.

Bien sûr, il y a trop de modèles de voiliers ici, nous n'avons pas besoin de modéliser chaque modèle, nous avons seulement besoin de modéliser plusieurs voiliers avec plus d'échantillons.

Parlons de la troisième question. La troisième question est de trouver d'abord les données, car la question ne fournit pas de données sur les prix à Hong Kong, nous devons les trouver nous-mêmes. Après avoir trouvé le prix, appliquez le modèle de régression obtenu à la première question et apportez les caractéristiques régionales à Hong Kong pour voir si le prix prédit par le modèle de régression est cohérent avec le prix réel. La cohérence signifie que les caractéristiques que nous avons données à exprimer la région sont utiles.

La seconde moitié de la troisième question demande si les effets régionaux de Hong Kong sur les prix des catamarans et des monocoques sont cohérents.Cette question demande essentiellement si la région a le même impact sur les prix des catamarans et des monocoques. Nous pouvons observer si les poids des caractéristiques régionales dans le modèle de régression pour le catamaran et le monocoque sont les mêmes.

La question quatre-cinq-deux est une question ouverte, et nous pouvons expliquer le poids de certaines fonctionnalités.

Caractéristiques à rechercher :

1. Les caractéristiques des différents types de voiliers (Variante), combien peuvent être trouvées :
Largeur : La largeur d'un bateau à son point le plus large
Largeur du bateau : la largeur du point le plus large du bateau.
Déplacement : Le poids du volume d'eau déplacé par un bateau
Déplacement : Le poids de l'eau déplacée par un bateau.
Tirant d'eau : Profondeur d'eau minimale requise pour faire flotter un bateau sans toucher le fond
Tirant d'eau : Profondeur d'eau minimale requise pour faire flotter un bateau sans toucher le fond.
Heures moteur : Le nombre d'heures de fonctionnement du ou des moteurs du bateau depuis neuf
Heures moteur : Le nombre d'heures de fonctionnement du ou des moteurs du bateau depuis neuf.
Hauteur sous barrot : La hauteur disponible pour se tenir debout dans la cabine
Hauteur sous barrot : La hauteur disponible pour se tenir debout dans la cabine.
Coque : Le corps principal ou la coque d'un navire ou d'un autre navire, y compris le fond, les côtés et le pont Coque
: Le corps principal ou la coque d'un navire ou d'un autre navire, y compris le fond, les côtés et le pont.
Matériaux de coque : les matériaux dont est faite la coque d'
un bateau . Les matériaux utilisés incluent la fibre de verre, l'acier, le bois et les matériaux composites. Les matériaux utilisés comprennent la fibre de verre, l'acier, le bois et les composites.
Surface de voilure : la surface totale des voiles d'un bateau lorsqu'il est entièrement levé.
Surface de voilure : la surface totale des voiles lorsqu'il est complètement levé.

2. Caractéristiques régionales :
latitude et longitude, PIB, population, revenu par habitant, etc.

3. Prix des différents types de voiliers à Hong Kong

Guess you like

Origin blog.csdn.net/yeqianqian_/article/details/130116054