2023美赛春季赛Y题全网最全数据包+可执行性代码+模型建立+43页PDF完整版思路整合。选择线性SVM、优化超参数的SVM、优化的决策树、集成学习-提升树、优化的集成学习模型;

2023美赛Y题思路如下:

1. 题目分析:首先由于二手帆船领域的专业性,相关数据信息的获取比较难,可以参考二手领域其他产品(二手车、二手房)的定价原理等信息来构建建模思路。其次,数据预处理方面,对缺失值的处理常用方法包括:最近邻算法、拉格朗日插值处理、三次卷积等。

2. 思路分析:定价模型在往常国赛出现过,可以用作思路参考。本题难度系数较大,核心是构建二手帆船定价模型,第一步我们可以搜集更多二手帆船领域的网站,第二步使用八爪鱼等爬虫技术进行数据爬取,第三步建立模型,将价格与其他数据信息建立关系。

3. 另外需要思考:分类数据与连续数据如何建立关系模型?两个分类变量关系可以使用卡方检验,而分类数据与连续数据之间关系可以用方差分析或者T检验,进而找到连续数据与分类数据之间的关系。前两题都是要求建立分类数据与连续数据的关系,注意尽量不要使用同一种方法分析。

问题三、讨论你对给定地理区域的建模如何在香港(SAR)市场上发挥作用。从提供的电子表格中选 择一个信息丰富的帆船子集,分为单船体和双体船。从香港(SAR)市场找到该子集的可 比上市价格数据。建模香港(特区)对子集中帆船的每艘帆船价格的区域影响(如果有的话)。 双体帆船和单体帆船的影响是一样的吗?

问题三,问题三的设问不同于问题一二,问题三要求我们单独的对香港这一地理区域进行价格评估,还需要我们判断对于双体帆船和单体帆船的影响是否相同。因此,我们依旧可以沿用问题一二的模型,比如当我们使用回归分析模型时,我们就需要提出地区指标的影响,选中香港的相关其他数据特征进行分析即可。

还有就是数据的注意点,我们可以发现对于整个Y题,他的结果都是相当开放的。我们通常对于这种结果开放式的题目是很喜欢的,原因就是对于这种题目,他的答案一定不是固定值,因此,只要合理就可以。如果保证合理呢,就需要我们大致的读一下文献,对现在这一现状有所了解,只要结果 不是离谱到家评委不能直接将我们的论文判定错误的 。所以,当我们真的真的找不到数据,或者找到的数据不好,代码编程运行出来的结果不理想时,对于这种开放式结果的题目,编造一个数据集,或者编造一个合理的结果是无可厚非的。

问题四、识别并讨论你的团队从数据中得出的任何其他有趣和有信息的推论或结论。

这种比较新颖的题目,细节类的。就需要大家在做题时,随时注意,有趣的结论,信息这种东西对于最后的评审也是很关键的。美赛的评审毕竟是7分制,一旦你的结论足够吸引人,很有可能提升一个档次是有可能的。因此,关于问题四,我的建议是从一开始的数据处理就时刻注意着,多找一些有趣的点,说不准哪一条就打动评委的心。比如,给出的数据最高的成交价格总是出现在某地,最低的价格总是怎样怎样。这个就真的是各显神通。

问题五、为香港(SAR)帆船经纪人准备一到两页的报告。包括一些精心挑选的图表,以帮助经纪 人理解你的结论。

问题五,数模题的常见类型,我们通常叫做非技术性文章,这就需要大家各显神通。题设中,明确的提示大家,可以包括一些图表。因此,大家可以仿照一些项目计划书等东西进行非技术性文章的写作即可。

总结:Y题的整体难度相对于Z题而言,应该是本次美赛春季赛中最难的一道题目。但是这个题目的整体难度,我认为在整个数模领域也仅仅是中等难度,因此大家不要有太大压力,尽力去做就可以。

猜你喜欢

转载自blog.csdn.net/ZHAIOJK/article/details/129886075