草庐IT

数学眼光

全部标签

仅需格式转换提升9%数学推理能力,上交开源新对齐方法ReAlign

大模型对齐新方法,让数学推理能力直接提升9%。上海交通大学生成式人工智能实验室(GAIRLab)新成果ReAlign,现已开源。随着以ChatGPT为代表的语言大模型的快速发展,研究人员意识到训练数据的质量才是大模型对齐的关键。然而,目前主流的提示数据质量的方法不是需要大量人工成本(人工构造高质量数据)就是容易遭受大模型幻觉的影响(从蒸馏数据中选择高质量样本)。ReAlign能以较小的人工成本提升现有数据集的质量,进而提升模型整体对齐能力,包含数学推理能力、回答问题的事实性、回答的可读性。目前,该项目开源了大量资源:ReAlign代码(使用方法和步骤均在Github中给出)ReAlign后的数

数学建模笔记之一起读论文2019年C题——机场的出租车问题

数学建模笔记之一起读论文——机场的出租车问题2021-8-28全国大学生数学建模竞赛2019年C题B站链接——国赛C题真题解析1赛题阅读与分析原题再现:问题C机场的出租车问题大多数乘客下飞机后要去市区(或周边)的目的地,出租车是主要的交通工具之一。国内多数机场都是将送客(出发)与接客(到达)通道分开的。送客到机场的出租车司机都将会面临两个选择:(A)前往到达区排队等待载客返回市区。出租车必须到指定的“蓄车池”排队等候,依“先来后到”排队进场载客,等待时间长短取决于排队出租车和乘客的数量多少,需要付出一定的时间成本。(B)直接放空返回市区拉客。出租车司机会付出空载费用和可能损失潜在的载客收益。在

数学建模【遗传算法】

一、遗传算法简介从做菜说起,小魏是一名大厨,想要创造一道美味的菜肴。首先随机生成多个原始配方,每种配方所用的原料(鸭脖、鸡肉、大肠等)与手法(煎炒焖炸卤炖)组合不同,现实中考虑调料用量、烹饪时间等等变量,会有无穷多种解,传统算法难以求解。请评委对几种配方做出的菜打分,分数高的配方进行配方交叉,保留一部分评分高的配方要素、舍弃评分低的配方。例如配方A和配方C的分数都高,A是卤鸭脖,C是炖大肠,配方交叉尝试新一组方案:“炖鸭脖”和“卤大肠”。有时会在配方交叉之后,再变更食材或烹饪方式。就像是在配方中随机使用了一些与原配方无关的调料或者做法(鸭脖改成鼠头),变异可能带来惊喜(评分高),也可能有惊无喜

2019年认证杯SPSSPRO杯数学建模D题(第一阶段)5G时代引发的道路规划革命全过程文档及程序

2019年认证杯SPSSPRO杯数学建模5G下十字路口车辆通行效率的讨论和建模D题5G时代引发的道路规划革命原题再现:  忙着回家或上班的司机们都知道交通堵塞既浪费时间又浪费燃料,甚至有的时候会带来情绪上的巨大影响,引发一系列的交通问题。据报道,每年交通拥堵使得美国市民在路上总共浪费了超过55亿小时,以及价值达到1210亿美元的29亿加仑燃料。虽然十字路口和州际公路的匝道处交通十分繁忙,但是大多数乡村公路却鲜有车流,道路占用率只有5%。  即将到来的5G(第五代移动通信网络)时代,将有可能解决这个问题,5G的无线传输带宽的峰值理论传输速度可达每秒10Gb以上,这样我们就可以让汽车之间实时共享信

离散数学笔记Discrete Mathematics

-------------------------------------------------------------------DesignBy2100301629王家寧第一章集合1.集合的运算①补运算②对称差运算2.集合运算的性质①集合运算的基本恒等式(可用文氏图进行相关推导)重点记忆德摩根律和补交转换律⑩和⑪德摩根律:补集分配进括号里面就把括号里面的交并符号反过来补交转换律:交补连着写可以换成差在证明题中,可以使用假设X来进行代入来证明,也可以通过举反例来列出具体的实例来推翻命题②容斥原理容斥原理由来:将相容重的集合部分在计算并集集合的基数的时候进行排斥出去,故称容斥原理基数:集合中

陶哲轩预测再成真!AI做出椭圆曲线难题重大发现,华人数学家接近千禧年大奖

用AI研究数学领域,最近又有重大发现了。这次数学家们用AI发现的,是椭圆曲线中的murmuration(椋鸟群飞)现象。他们发现,如果以正确的方式观察,在椭圆曲线中会出现像飞行中的椋鸟群一般的图案。现在,murmuration相关研究已经轰动了数学圈,每周都有相关新研究问世。令人不可思议的是,这个发现是由数个偶然组成的——椭圆曲线的数据,恰巧按照conductor来排序;一个经验不足的本科生,恰巧没有处理某个数值,让曲线的震荡极为明显;按照conductor预排序的数据集,恰巧被人提前做了出来……任何一个要素的变动,都会导致人类与这一重要的数学发现失之交臂,或许再晚上几十年……并且,被陶哲轩认

数学建模理论与实践国防科大版

目录1.数学建模概论2.生活中的数学建模2.1.行走步长问题2.2.雨中行走问题2.3.抽奖策略2.4.《非诚勿扰》女生的“最优选择”3.集体决策模型3.1.简单多数规则3.2.Borda数规则3.3.群体决策模型公理和阿罗定理1.数学建模概论1.数学模型的概念2.数学建模的概念3.数学建模的一般过程自然界是按照数学原则设计的,自然界的真正规律必然能够通过数学来探索和表达。几个数学建模的问题知了鸣叫问题网络犯罪信息的甄别(犯罪克星)树叶形状问题哥尼斯堡七桥问题传球游戏问题1.概率解法:2.蒙特卡洛解法:计算机模拟传球N回合,每回合传10次,记录下N回合传球中求最终回到A手中的次数L,则:P=L

java - 使用正则表达式的数学集验证

我需要验证给定字符串的用户并验证它是一个有效的集合,可能是一个包含内部集合的集合。示例:1){1,2,3,4}=valid2){1,2,{3,4},5}=valid3)1,2,3,4=invalid(missingbrackets)4){1,2,{3,4,5}=invalid(missinginnerbracket)这是我正在使用的正则表达式(为了便于阅读而分解):StringelementSeparator="(,\\s)?";StringvalidElement="(\\{?[A-Za-z0-9]*\\}?"+elementSeparator+")*";Stringregex="^

数学建模-动态规划&遗传算法(美赛运用)

动态规划模型的要素是对问题解决的抽象,其可分为:阶段。指对问题进行解决的自然划分。例如:在最短线路问题中,每进行走一步的决策就是一个阶段。状态。指一个阶段开始时的自然状况。例如:在最短线路问题中,每进行走一步后,对所走的点进行标注。决策。当一个阶段的状态确定后,作出选择从而演变到下一阶段的某个状态的选择手段称为决策,在优控制问题中也称为控制。策略。由决策组成的序列称为策略。由第k到第j阶段的策略可记作下面以我在建模美赛中的题目实列来阐述:背景美国和加拿大的五大湖是世界上最大的淡水湖群。这五个湖泊和相连的水道构成了一个巨大的流域,其中包含了这两个国家的许多大城市,气候和当地的天气条件各不相同。湖

java - 2D 游戏中跳跃的数学运算

我在J2ME工作,我的游戏循环执行以下操作:publicvoidrun(){Graphicsg=this.getGraphics();while(running){longdiff=System.currentTimeMillis()-lastLoop;lastLoop=System.currentTimeMillis();input();this.level.doLogic();render(g,diff);try{Thread.sleep(10);}catch(InterruptedExceptione){stop(e);}}}所以这只是一个基本的游戏循环,doLogic()函数调