浮点数二分

c++ - 在 C++ 中进行数学运算时，浮点错误如何传播？

假设我们声明了以下变量floata=1.2291;floatb=3.99;float变量的精度为6，这(如果我理解正确的话)意味着计算机实际存储的数字与您想要的实际数字之间的差异将小于10^-6这意味着a和b都有一些小于10^-6的误差所以在计算机内部a实际上可能是1.229100000012123而b可能是3.9900000191919现在假设您有以下代码floatc=0;for(inti=0;i我的问题是，c的最终结果是否也会有小于10^-6的精度误差？如果答案是否定的，我们如何才能真正知道这个精度误差，以及如果您应用任何类型的操作，按您希望的次数和以任何顺序到底会发生什么？

中进 amp code section blockquote c++c floating-point floating-accuracy floating-point-precision

c++ - 浮点乘积扩展等价

在IEEE754float中，有可能a*(b-c)!=a*b-a*c//a,b,cdouble因此不能保证展开的产品与未展开的产品相等。但是这个呢:a*(b1+b2+...+bn)==a*b1+a*b2+...+a*bn//b1==b2==...==bn当所有b相等时，是否保证等价(在没有下溢/上溢的情况下)？如果b的相等性在编译时是否已知，是否有区别？编辑:它不是-参见EricPostpischil和PascalCuoq。但也许持有较弱的断言？:(1.0/n)*(b1+b2+...+bn)我只是想知道您是否可以保证数据集的平均值不超过某个值每个数据值也不超过，无论您如何计算平均值(先

amp 43 code section 1.0 c++floating-point

c++ - 如何测试文件存储的浮点表示？

这个问题在这里已经有了答案:HowtocheckifC++compilerusesIEEE754floatingpointstandard(2个答案)关闭7年前。我已将科学数据转储到文件中。目前，我只是用与内存中相同的表示形式丢弃了它们。我已经记录了它们是IEEE754，但我希望在代码中声明这一点，这样如果它被移植到一个奇怪的架构并与我的文档分开(研究代码被传递)它会在编译时出错。目前我有static_assert(sizeof(double)==8),"message");有没有办法测试IEEE754？可以静态断言吗？

amp 43 section notice 时出 c++c++11 floating-point

c++ - 高效的浮点比较(Cortex-A8)

有一个很大(~100000)的浮点点变量数组，并且有一个阈值(也是浮点点)。问题是我必须将数组中的每个变量与阈值进行比较，但NEON标志传输需要很长时间(根据分析器，大约20个周期)。是否有任何有效的方法来比较这些值？注意:由于舍入误差无关紧要，我尝试了以下操作:floatarr[10000];floatthreshold;....inta=arr[20];//e.g.intt=threshold;if(t>a){....}但在这种情况下，我得到以下处理器命令序列:vldr.32s0,[r0]vcvt.s32.f32s0,s0vmovr0,s0由于转换发生在NEON上，因此无论我是通过

amp Cortex-A 1.500000 500000 000000 c++c neon cortex-a8 arm7

c++ - 没有将 bool 隐式转换为浮点类型的警告？

看起来这个片段在clang中编译时没有警告，即使使用了-Weverything:doublex;...if(fabs(x>1.0)){...}我错过了什么吗？还是编译器和C++标准认为将bool转换为double是有意义的？最佳答案这是使bool成为整数类型的结果。根据C++标准，第3.9.1.6节Valuesoftypeboolareeithertrueorfalse(Note:Therearenosigned,unsigned,short,orlongbooltypesorvalues.—endnote)Valuesofty

amp 43 code section bool c++clang compiler-warnings implicit-conversion

c++ - 为什么在 C++17 中使用十六进制浮点常量？

C++17添加十六进制浮点常量(floatingpointliteral)。为什么？举几个例子来说明好处如何。最佳答案 float以2为基数存储在x86/x64处理器中，而不是以10为基数:https://en.wikipedia.org/wiki/Double-precision_floating-point_format.由于无法准确表示许多十进制float，例如十进制0.1可以表示为0.1000000000000003或0.0999999999999997-任何具有足够接近十进制0.1的基数2表示形式。由于这种不精确性，例如

amp 进制 code 十进 c++floating-point constants c++17

零附近的 C++ 浮点比较与 Gtest 失败

我们为我的一个单元测试苦苦挣扎了很长一段时间。在调查过程中，我们找到了根本原因，这似乎是float的比较(参见以下代码片段，我简化了计算但仍然失败)。TEST_F(MyFloatTest,thisOneDoesFail){constfloattoCompare=0.2f-1.0f+0.9f;EXPECT_FLOAT_EQ(toCompare,0.1f);}结果是:Actual:0.1Expected:toCompareWhichis:0.099999964虽然有一些数值数学背景，但我们仍然无法弄清楚为什么这个测试失败了，而使用std::numerical_limits::epsilon

amp Gtest toCompare section EXPECT_FLOAT_EQ c++floating-point googletest numerical

c++ - 当没有 float 数据类型时，为什么这段代码会出现浮点异常？

我没有除以零并且我的代码中没有float据类型，我仍然得到浮点异常。#include#include#include#include#includeusingnamespacestd;intmain(){unsignedlonglongintt,n;cin>>t;while(t--){cin>>n;unsignedlonglongintdeno=pow(10,n-1),count=2,sum=0,f1=1,f2=1;while(1){sum=f1+f2;f1=f2;f2=sum;count++;if((int)(sum/deno)>0){cout所有之前关于相同的问题都有类似的除以零的

amp float code section noreferrer c++c++14 floating-point-exceptions

c++ - 浮点计算的变化取决于编译器

当我运行完全相同的代码来执行在Windows和Solaris上编译的完全相同的浮点计算(使用double)时，我得到的结果略有不同。我知道由于舍入误差，结果不准确。然而，我希望舍入误差与平台无关，从而在两个平台上给出相同(稍微不正确)的结果，但事实并非如此。这是正常的，还是我的代码有其他问题？最佳答案在x86上，通常大多数计算都是使用80位数量进行的，除非另外强制为double。我所知道的大多数其他架构都以double进行所有计算(同样，除非以其他方式被覆盖)。我不知道您是在SPARC还是x86上运行Solaris，但如果是前者

取决于取决 section double stackoverflow c++c floating-point

c++ - 将二进制值转换为浮点值的计算器——我做错了什么？

我有以下代码，它以二进制形式将6个float写入磁盘并读回:#include#includeintmain(){intnumSegs=2;intnumVars=3;float*data=newfloat[numSegs*numVars];for(inti=0;i输出:00.230.460.690.921.1500.230.460.690.921.15当我在hexer中加载文件时，我们得到:000000001f856b3e1f85eb3ed7a3303f1f856b3f3333933f----------------我想直接从小数计算浮点值。例如:1f856b3e变为0.23，1f85e

mdash amp code section numSegs c++endianness ieee-754

18 19 202122 23 24