2023 Meisai Question Y Prix des voiliers d'occasion -- Documents finis, idées, données, codes

Prix ​​voilier d'occasion titre Meisai Y 2023

Partagez les derniers progrès sur CSDN pour la première fois dans
la carte au bas de l'article, rejoignez-nous pour obtenir des ressources de première main : 2023 Meisai Y-question prix du voilier d'occasion papiers finis, idées, données, codes

image-20230401012549317

Des informations sur les caractéristiques des voiliers peuvent être fournies :
BoatTrader (https://www.boattrader.com/) : Un site Internet qui permet de rechercher des voiliers neufs et d'occasion selon différents critères dont la longueur, la marque et le modèle. Ce site peut fournir quelques informations de base sur les caractéristiques d'un voilier telles que la largeur, le tirant d'eau et le déplacement.
SailboatData (https://sailboatdata.com/) : Base de données des spécifications et des dessins des voiliers. Le site comprend des informations sur la largeur, le tirant d'eau, le déplacement, la surface de voile et d'autres caractéristiques de navigation pour différents modèles de voiliers.
YachtWorld (https://www.yachtworld.com/) : un site Web qui vous permet de rechercher des voiliers neufs et d'occasion en fonction de divers critères, notamment la longueur, la marque et le modèle. Ce site peut fournir quelques informations de base sur les caractéristiques d'un voilier telles que la largeur, le tirant d'eau et le déplacement.
Sailing Magazine (https://www.sailmagazine.com/boats) : , un site Web proposant des critiques et des articles sur la voile. Ce site Web peut fournir des informations sur les caractéristiques du voilier telles que le gréement, la surface de voilure, les matériaux de coque et l'électronique. En cours de mise à jour, entrez dans le groupe à temps, je posterai l'avis de mise à jour dès que possible dans le groupe
Afin de construire un modèle mathématique pour expliquer l'étiquette de prix de chaque voilier dans le tableur fourni, nous pouvons utiliser l'analyse de régression . L'analyse de régression est une méthode statistique utilisée pour déterminer la relation entre une variable dépendante (dans ce cas, le prix d'inscription) et une ou plusieurs variables indépendantes (telles que la marque, la variante, la longueur, la région géographique, l'année, etc.).
Les statistiques récapitulatives fourniront des informations sur les coefficients, les erreurs standard, les valeurs p et les valeurs r au carré pour chaque variable du modèle. Nous pouvons utiliser ces informations pour évaluer l'exactitude des estimations de prix pour chaque race de voilier et déterminer quelles variables sont les plus importantes pour prédire les prix d'inscription.
En plus des données fournies, nous pouvons utiliser d'autres sources pour connaître d'autres caractéristiques d'un voilier donné comme la largeur, le tirant d'eau, le déplacement, le gréement, la surface de voilure, le matériau de la coque, les heures moteur, la capacité de couchage, la hauteur sous barrot, l'électronique, etc. Des données économiques par année et par région sont également disponibles pour une analyse complémentaire. Par exemple, nous pouvons inclure des variables telles que les taux d'inflation, les taux de change et les taux d'intérêt pour tenir compte des facteurs économiques susceptibles d'affecter les prix affichés. Les sources de ces données peuvent inclure des rapports de l'industrie, des statistiques gouvernementales et des études de marché.

import pandas as pd
import numpy as np
import statsmodels.api as sm

# 加载数据
monohulls = pd.read_csv('Monohulled Sailboats.csv')
catamarans = pd.read_csv('Catamarans.csv')

# 类别特征编码
monohulls = pd.get_dummies(monohulls, columns=['Geographic Region'])
catamarans = pd.get_dummies(catamarans, columns=['Geographic Region'])

# 合并
data = pd.concat([monohulls, catamarans], ignore_index=True)

# 选择变量进行回归分析
X = data[['Length (ft)', 'Year', 'Make', 'Variant', 'Geographic Region_Caribbean', 'Geographic Region_Europe', 'Geographic Region_United States']]
y = data['Listing Price (USD)']

# 在自变量中加上常数项
X = sm.add_constant(X)

# 拟合线性回归模型
model = sm.OLS(y, X).fit()

# 打印模型的汇总统计信息
print(model.summary())

Pour analyser l'effet de la région sur les prix d'inscription des voiliers, nous pouvons utiliser un modèle de régression qui inclut la région géographique comme variable prédictive. Plus précisément, nous pouvons ajuster un modèle de régression linéaire de la forme suivante :
prix d'inscription = β0 + β1 * longueur + β2 * année + β3 * région
où le prix d'inscription est la variable dépendante et la longueur et l'année sont des variables indépendantes continues désignant respectivement les voiliers Longueur et l'année de fabrication, et la région sont des variables indépendantes catégorielles, indiquant la région géographique dans laquelle se trouve le voilier (Europe, Caraïbes ou États-Unis). β0, β1, β2 et β3 sont les coefficients de régression reflétant l'influence de chaque variable indépendante sur la variable dépendante.
La bibliothèque statmodels de Python pour ajuster les modèles de régression et obtenir des estimations des coefficients de régression.

import pandas as pd
import statsmodels.api as sm

# 加载数据
sailboats = pd.read_csv("monohulled sailboats.csv")

# 拟合模型
model = sm.formula.ols("Listing_Price ~ Length + Year + C(Geographic_Region)", data=sailboats).fit()

# 输出统计信息
print(model.summary())

在上面的代码中,我们使用statmodels中的ols函数来拟合一个线性回归模型,其中Listing_Price作为因变量,Length和Year作为连续自变量,Geographic_Region作为分类自变量。C()符号指定应将地理区域(Geographic_Region)视为分类变量。
model.summary()的输出将包括回归系数的估估值,包括地理区域的系数。我们可以用这些估计来分析地区对上市价格的影响。
如果地理区域的系数具有统计学意义(即p值小于选定的显著性水平,通常为0.05),那么我们可以得出结论,在控制了帆船长度和制造年份后,区域对上市价格具有显著影响。我们还可以通过对系数符号的解读,来确定某一特定地区的帆船的挂牌价格往往高于或低于其他地区的帆船。
要分析区域效应在所有帆船变体中是否一致,可以从按地区查看帆船列表的分布开始。这可以让我们初步了解是否某些地区在数据集中的比例更高,以及在哪些地区的挂牌价格往往更高或更低方面是否存在明显的模式。可以使用Python和pandas库来读入Monohulled sailboats.csv和Catamarans.csv文件,然后使用value_counts()方法来计算每个区域中的清单数量:
import pandas as pd

monohulls_df = pd.read_csv('Monohulled sailboats.csv')
catamarans_df = pd.read_csv('Catamarans.csv')

# 计算单船体船在每个区域的清单数量
monohulls_region_counts = monohulls_df['Geographic Region'].value_counts()
print("Monohulls region counts:")
print(monohulls_region_counts)

# 计算每个地区双体船的挂牌数量
catamarans_region_counts = catamarans_df['Geographic Region'].value_counts()
print("Catamarans region counts:")
print(catamarans_region_counts)
由此,我们可以看到,美国的单体船挂牌数量最多,而加勒比海的双体船挂牌数量最多。我们还可以看到,单船和双体船在各个地区的列表分布是不一样的,例如,欧洲的单船列表比双体船多,而加勒比海的双体船列表比单船多。
为了分析地域对上市价格的影响,我们可以使用以地域为分类预测变量的线性回归模型。我们可以加入其他相关的预测变量,如长度和年份,以控制它们对上市价格的影响。
import statsmodels.api as sm

# 将数据子集化,只包含相关的预测变量
monohulls_data = monohulls_df[['Length (ft)', 'Year', 'Geographic Region', 'Listing Price (USD)']].dropna()
catamarans_data = catamarans_df[['Length (ft)', 'Year', 'Geographic Region', 'Listing Price (USD)']].dropna()

# 类别特征编码
monohulls_data = pd.get_dummies(monohulls_data, columns=['Geographic Region'], prefix='region')
catamarans_data = pd.get_dummies(catamarans_data, columns=['Geographic Region'], prefix='region')

# 拟合模型
monohulls_model = sm.OLS(monohulls_data['Listing Price (USD)'], sm.add_constant(monohulls_data[['Length (ft)', 'Year', 'region_Caribbean', 'region_Europe']]))
monohulls_results = monohulls_model.fit()
print("Monohulls regression results:")
print(monohulls_results.summary())

# 拟合双体船线性回归模型
catamarans_model = sm.OLS(catamarans_data['Listing Price (USD)'], sm.add_constant(catamarans_data[['Length (ft)', 'Year', 'region_Caribbean', 'region_Europe

image-20230401010626390

image-20230401010701281

image-20230401010748508

image-20230401010950984

Je suppose que tu aimes

Origine blog.csdn.net/weixin_57198749/article/details/129891846
conseillé
Classement