浮点

c++ - Eigen 浮点精度

我在使用Eigen时遇到浮点精度问题。我有两个Eigen::MatrixXd；第一个矩阵A(nx1)仅包含正整数，而第二个矩阵B(nx1)包含填充相同实数的单个列(例如:-0.714312).我需要计算以下Eigen::MatrixXd:constautoexponential=[](doublex){returnstd::exp(x);};MatrixXdW=B.unaryExpr(exponential);MatrixXdresiduals=A-W;问题是当我打印残差总和时:cout通过使用R和相同的输入矩阵执行相同的操作，我得到了不同的值。通过使用R矩阵，我得到-2.950208

c++ - 用于提高中间浮点计算精度的编译器标志

gcc/clang中是否有指定中间浮点计算精度的标志？假设我有一个C代码doublex=3.1415926;doubley=1.414;doublez=x*y;是否有一个编译器标志允许以用户机器的最高可能精度计算'x*y'，比如说，long-double(64位尾数)，然后截断回double(53位)尾数，声明变量类型的精度)？仅供引用，我在64位机器上使用Ubuntu14.04。最佳答案海湾合作委员会[编辑观察到的gcc4.8.4行为，其中默认行为与文档相反]您需要使用x87FPU中的80位寄存器。使用-mfpmath=387

amp 43 寄存 code double c++c compilation floating-point precision

c++ - NEON 浮点乘法比预期慢

我有两个float标签。我需要将第一个选项卡中的元素乘以第二个选项卡中的相应元素，并将结果存储在第三个选项卡中。我想使用NEON来并行化float乘法:同时进行四个float乘法而不是一个。我预计会有显着的加速，但我只实现了大约20%的执行时间减少。这是我的代码:#include#include#includeconstintn=100;//tablesize/*fillatabwithrandomfloats*/voidrand_tab(float*t){for(inti=0;i我运行以下命令进行编译:g++-mfpu=neon-ffast-mathneon_test.cpp我的CP

法比 amp float Cortex-A section c++gcc arm simd neon

c++ - 从预乘浮点 RGBA 转换为 8 位 RGBA 的有效方法？

我正在寻找一种更有效的方法，将在预乘色彩空间中存储为double的RGBA转换为8位整数/channelRGBA非预乘色彩空间。这对我的图像处理来说是一项巨大的成本。对于一个channel，比如R，代码看起来像这样:doubletemp=alpha>0?src_r/alpha:0uint8_tout_r=(uint8_t)min(255,max(0,int(temp*255+0.5)))这涉及三个条件，我认为它们会阻止编译器/CPU尽可能地优化它。我认为某些芯片，特别是x86_64具有专门的双钳位操作，因此理论上上述可能无需条件就可以实现。是否有一些技术或特殊功能可以使这种转换更快？我

RGBA amp tmp mm c++c

c++ - 为什么编译时浮点计算的结果可能与运行时计算的结果不同？

在constexpr:Introduction，演讲者提到“编译时浮点计算可能与运行时计算的结果不同”:而原因与“交叉编译”有关。老实说，我不太清楚这个想法。恕我直言，不同的平台也可能有不同的整数实现。为什么它只影响float？或者我错过了什么？最佳答案 Whydoesitonlyaffectfloatingpoints?因为标准没有对浮点运算精度施加限制。根据expr.const,强调我的:[ Note:Sincethisdocumentimposesnorestrictionsontheaccuracyoffloating-p

amp 43 section code strong c++floating-point language-lawyer constexpr floating-accuracy

c++ - 如何截断 XMM 寄存器中的浮点值

如何只获取float的整数部分？所以，我有一个float组:x[4]={5.0,13.0,25.0,41.0};我把它放在xmm0中，然后用它做sqrt。我还需要一个命令来帮助仅获取此sqrt的一部分。例如5的sqrt将是2.236068，我只需要2.0的答案代码:__asm{movupsxmm0,xsqrtpsxmm0,xmm0//hereneedsomecommandmovupsx,xmm0} 最佳答案使用roundps是最简单的。舍入模式表在其他地方，但您需要舍入模式3(接近零)。只有当输入保证在某个范围内(大约0到4.6e

寄存 amp code section xmm0 c++c assembly sse

c++ - 浮点转换和性能

我知道在float和整数之间进行转换时可能会出现错误，但是性能如何(请忽略精度问题)？如果我对不同算术类型的操作数进行n元运算，即对不同的浮点类型(例如float和double)和浮点/整数类型组合(例如float和int)？是否存在经验法则，例如让所有操作数保持同一类型？P.S.:我问是因为我正在编写一个表达式模板库，并且想知道是否允许对包含不同算术类型的值的vector进行二元运算。最佳答案我怀疑这个问题的答案会因目标架构而异，因为转换可以(但可能不会)发生在硬件中。例如，考虑以下代码，它导致int和float之间的一些相互

amp 43 x00000000004004 00000000004004 code c++c performance floating-point

c++ - C/C++ 中浮点常量的紧凑无损表示

我有一个用C++编写的程序，它正在生成用于数学计算的C源代码。我注意到常量在生成的代码中占用了很多空间，正在寻找更紧凑的表示形式。为了生成常量，我现在使用:doublev=...cfile::digits10+1)我很确定这是一种无损表示，但它也非常臃肿。例如，零和一将表示为0.0000000000000000e+00和1.0000000000000000e+00。和“0”。或“1”。携带同样多的信息。有没有办法以更紧凑但仍然无损的方式将常量打印到文件中？它不需要对人类读者来说看起来很好，只要在纯C代码中出现就可以编译(如果是C99，我更愿意它也是有效的C++)。如果它是可移植的，十六

amp 43 code section 进制 c++c hex code-generation lossless

c++ - 有了模板，如何区分两种并列的情况，比如浮点型和整数型？

cppreference.com(http://en.cppreference.com/w/cpp/types/enable_if#Notes)指出:Acommonmistakeistodeclaretwofunctiontemplatesthatdifferonlyintheirdefaulttemplatearguments.Thisisillegalbecausedefaulttemplateargumentsarenotpartoffunctiontemplate'ssignature,anddeclaringtwodifferentfunctiontemplateswitht

整数型并列 section template Floating c++templates sfinae

c++ - 什么时候浮点变量不等于自身

我在编程测试中被问到这个问题。问题是，我被传入一个float作为参数，并询问以下代码何时为假。boolresult=(floatValue==floatValue);我想不出一个合理的理由或什么时候这是错误的，但仍然不能。最后，我回答说，这绝不会是假的。想知道是否有人可以给我一些例子来说明什么时候这是错误的最佳答案 float==NaN如果floatValue是非数字的计算结果，例如0/0。关于c++-什么时候浮点变量不等于自身，我们在StackOverflow上找到一个类似的问题：

不等 amp section floatValue 子来 c++floating-point

8 9 101112 13 14