草庐IT

2023美赛春季赛Y题保姆级思路及代码 了解二手帆船

不知名数学家小P 2023-05-18 原文

2023_MCM_Problem_Y  Understanding Used Sailboat Prices

背景:

和许多奢侈品一样,帆船的价值会随着老化和市场条件的变化而变化。附件中所附的 “2023_MCM_Problem_Y_Boats.xlsx”文件包括了2020年12月在欧洲、加勒比海和美国登 广告出售的大约3500艘36至56英尺长的帆船的数据。一位划船爱好者向COMAP提供了这些 数据。像大多数真实世界的数据集一样,它可能有缺失的数据或其他需要在分析之前进 行一些数据清理的问题

Excel文件包括两个标签,一个为单体帆船和一个为双体帆船。在每个标签、列分别标记为“制造”、“变量”、长度(英尺)、地理区域、国家 /地区/州、挂牌价格(美元)和年份(制造)。 对于给定的制造、变体和年份,除了提供的Excel文件之外,还有许多其他来源可以提供 对特定帆船特性的详细描述。您可以用您所选择的任何附加数据来补充所提供的数据集 ;但是,您必须在建模中包含“2023_MCM_Problem_Y_Boats.xlsx”中的数据。请确保完全识别和记录所使用的任何补充数据的来源。 帆船经常通过经纪人出售。为了更好地了解帆船市场,香港(特区)的一位帆船经纪公 司委托你的团队准备一份关于二手帆船定价的报告。经纪人希望您能够:

思路:

问题1:建立一个数学模型,解释所提供的电子表格中每艘帆船的上市价格。包括任何你认为有用的预测因素。你可以利用其他资料来了解特定帆船的其他特征(如船宽、吃水、排水量、索具、帆面积、船体材料、发动机小时数、睡眠容量、净空、电子设备等),以及各年和各地区的经济数据。识别和描述所有使用的数据来源。包括讨论你对每个帆船品种价格的估计的精确性。

这道题目标是对每艘帆船的上市价格进行预测,可以以帆船价格作为Y,其他变量作为X,具体解题方法如下:

step1:尽可能构造或者收集得到更多相关数据,这个是得分的关键,也是这道题的最难点。我们需要尽可能多地找到相关数据进行补全,

例如帆船数据:

例如各地区的经济数据:

经济与吞吐量数据均为2019年数据,数据来源:世界银行、国际货运与贸易协会、世界经济论坛。

step2:用图表描述以上这些数据

step3:以帆船价格作为Y,任何可能影响到预测价格的变量作为X,构建回归预测模型,可以采用线性回归、Xgboost、LGBM、随机森林、神经网络、决策树等等,这里推荐用机器学习。

step4:对模型进行评价与模型调优,模型调优可以结合想PSO、遗传算法等等启发式算法,提升文章逼格。

问题2:用你的模型来解释区域对上市价格的影响(如果有的话)。讨论一下任何地区性的影响是否在所有帆船的变体中都是一致的。讨论任何区域效应的实际和统计学上的意义。

一方面我们可以输出模型的指标重要性,查看地区指标带来的影响程度,另一方面,可以采用shap模型,对影响的正负向整体情况进行深入分析。

而要讨论任何地区的影响是否在所有帆船的变体中都是一致的,这个我们可以通过双因素方差分析,以地区为分组项1,以帆船为分组项2,价格作为分析项,分析不同地区不同帆船是否存在价格差异,直接查看其显著性P值是否呈现统计学差异即可。

问题3:讨论如何利用所给出的地理区域模型在香港特别行政区市场上有用。从提供的电子表格中选择一组信息量大的单体帆船和双体帆船子集,并找到这个子集在香港特别行政区市场上的对比售价数据。模拟香港特别行政区对于每种船只价格的地区效应,如果有的话,这种效应对于单体帆船和双体帆船是否相同。

由于原始数据中没有提供香港的帆船价格数据,同时想要在网上找到某款帆船在香港的价格,基本难如登天,但是我们可以从经济和货运水平相关指标来建立一个区域仿真模型,具体做法是在问题1中加入交通相关指标,训练并拟合好一个模型后,将其他地区的经济指标和交通水平指标调整为香港的值,然后预测出香港特别行政区对于每种船只价格,在与原来的价格进行对比计算后,就可以得到与各地区的效应对比情况,接着用配对样本T检验等差异性分析算法对单体帆船和双体帆船的效应进行分析即可。

问题4,5: 识别并讨论你的团队从数据中得出的任何其他有趣的、有信息量的推论或结论。为香港(特区)的帆船经纪人准备一份一到两页的报告。包括一些精心挑选的图形,以帮助经纪人理解你的结论。

这个可以结合问题1~3中的数据描述,去自由做更进一步分析,自由发挥。

思路详细讲解可看B站视频

2023美赛春季赛Y题保姆级思路及完整解题代码 了解二手帆船的价格_哔哩哔哩_bilibili

有关2023美赛春季赛Y题保姆级思路及代码 了解二手帆船的更多相关文章

  1. ruby - 如何在 buildr 项目中使用 Ruby 代码? - 2

    如何在buildr项目中使用Ruby?我在很多不同的项目中使用过Ruby、JRuby、Java和Clojure。我目前正在使用我的标准Ruby开发一个模拟应用程序,我想尝试使用Clojure后端(我确实喜欢功能代码)以及JRubygui和测试套件。我还可以看到在未来的不同项目中使用Scala作为后端。我想我要为我的项目尝试一下buildr(http://buildr.apache.org/),但我注意到buildr似乎没有设置为在项目中使用JRuby代码本身!这看起来有点傻,因为该工具旨在统一通用的JVM语言并且是在ruby中构建的。除了将输出的jar包含在一个独特的、仅限ruby​​

  2. ruby-on-rails - Rails 源代码 : initialize hash in a weird way? - 2

    在rails源中:https://github.com/rails/rails/blob/master/activesupport/lib/active_support/lazy_load_hooks.rb可以看到以下内容@load_hooks=Hash.new{|h,k|h[k]=[]}在IRB中,它只是初始化一个空哈希。和做有什么区别@load_hooks=Hash.new 最佳答案 查看rubydocumentationforHashnew→new_hashclicktotogglesourcenew(obj)→new_has

  3. ruby-on-rails - 浏览 Ruby 源代码 - 2

    我的主要目标是能够完全理解我正在使用的库/gem。我尝试在Github上从头到尾阅读源代码,但这真的很难。我认为更有趣、更温和的踏脚石就是在使用时阅读每个库/gem方法的源代码。例如,我想知道RubyonRails中的redirect_to方法是如何工作的:如何查找redirect_to方法的源代码?我知道在pry中我可以执行类似show-methodmethod的操作,但我如何才能对Rails框架中的方法执行此操作?您对我如何更好地理解Gem及其API有什么建议吗?仅仅阅读源代码似乎真的很难,尤其是对于框架。谢谢! 最佳答案 Ru

  4. ruby - 模块嵌套代码风格偏好 - 2

    我的假设是moduleAmoduleBendend和moduleA::Bend是一样的。我能够从thisblog找到解决方案,thisSOthread和andthisSOthread.为什么以及什么时候应该更喜欢紧凑语法A::B而不是另一个,因为它显然有一个缺点?我有一种直觉,它可能与性能有关,因为在更多命名空间中查找常量需要更多计算。但是我无法通过对普通类进行基准测试来验证这一点。 最佳答案 这两种写作方法经常被混淆。首先要说的是,据我所知,没有可衡量的性能差异。(在下面的书面示例中不断查找)最明显的区别,可能也是最著名的,是你的

  5. ruby - 寻找通过阅读代码确定编程语言的ruby gem? - 2

    几个月前,我读了一篇关于ruby​​gem的博客文章,它可以通过阅读代码本身来确定编程语言。对于我的生活,我不记得博客或gem的名称。谷歌搜索“ruby编程语言猜测”及其变体也无济于事。有人碰巧知道相关gem的名称吗? 最佳答案 是这个吗:http://github.com/chrislo/sourceclassifier/tree/master 关于ruby-寻找通过阅读代码确定编程语言的rubygem?,我们在StackOverflow上找到一个类似的问题:

  6. ruby - Net::HTTP 获取源代码和状态 - 2

    我目前正在使用以下方法获取页面的源代码:Net::HTTP.get(URI.parse(page.url))我还想获取HTTP状态,而无需发出第二个请求。有没有办法用另一种方法做到这一点?我一直在查看文档,但似乎找不到我要找的东西。 最佳答案 在我看来,除非您需要一些真正的低级访问或控制,否则最好使用Ruby的内置Open::URI模块:require'open-uri'io=open('http://www.example.org/')#=>#body=io.read[0,50]#=>"["200","OK"]io.base_ur

  7. 程序员如何提高代码能力? - 2

    前言作为一名程序员,自己的本质工作就是做程序开发,那么程序开发的时候最直接的体现就是代码,检验一个程序员技术水平的一个核心环节就是开发时候的代码能力。众所周知,程序开发的水平提升是一个循序渐进的过程,每一位程序员都是从“菜鸟”变成“大神”的,所以程序员在程序开发过程中的代码能力也是根据平时开发中的业务实践来积累和提升的。提高代码能力核心要素程序员要想提高自身代码能力,尤其是新晋程序员的代码能力有很大的提升空间的时候,需要针对性的去提高自己的代码能力。提高代码能力其实有几个比较关键的点,只要把握住这些方面,就能很好的、快速的提高自己的一部分代码能力。1、多去阅读开源项目,如有机会可以亲自参与开源

  8. 华为OD机试用Python实现 -【明明的随机数】 2023Q1A - 2

    华为OD机试题本篇题目:明明的随机数题目输入描述输出描述:示例1输入输出说明代码编写思路最近更新的博客华为od2023|什么是华为od,od薪资待遇,od机试题清单华为OD机试真题大全,用Python解华为机试题|机试宝典【华为OD机试】全流程解析+经验分享,题型分享,防作弊指南华为o

  9. 7个大一C语言必学的程序 / C语言经典代码大全 - 2

    嗨~大家好,这里是可莉!今天给大家带来的是7个C语言的经典基础代码~那一起往下看下去把【程序一】打印100到200之间的素数#includeintmain(){ inti; for(i=100;i 【程序二】输出乘法口诀表#includeintmain(){inti;for(i=1;i 【程序三】判断1000年---2000年之间的闰年#includeintmain(){intyear;for(year=1000;year 【程序四】给定两个整形变量的值,将两个值的内容进行交换。这里提供两种方法来进行交换,第一种为创建临时变量来进行交换,第二种是不创建临时变量而直接进行交换。1.创建临时变量来

  10. git使用常见问题(提交代码,合并冲突) - 2

    文章目录git常用命令(简介,详细参数往下看)Git提交代码步骤gitpullgitstatusgitaddgitcommitgitpushgit代码冲突合并问题方法一:放弃本地代码方法二:合并代码常用命令以及详细参数gitadd将文件添加到仓库:gitdiff比较文件异同gitlog查看历史记录gitreset代码回滚版本库相关操作远程仓库相关操作分支相关操作创建分支查看分支:gitbranch合并分支:gitmerge删除分支:gitbranch-ddev查看分支合并图:gitlog–graph–pretty=oneline–abbrev-commit撤消某次提交git用户名密码相关配置g

随机推荐