floating-point-conversion

c++ - float、double 和 long double 是否有保证的最小精度？

从我之前的问题“Isfloatingpointprecisionmutableorinvariant?”我收到了一个response其中说，CprovidesDBL_DIG,DBL_DECIMAL_DIG,andtheirfloatandlongdoublecounterparts.DBL_DIGindicatestheminimumrelativedecimalprecision.DBL_DECIMAL_DIGcanbethoughtofasthemaximumrelativedecimalprecision.我查看了这些宏。它们位于标题中。.来自cplusplusreference

c++ - 比较一个 32 位 float 和一个 32 位整数而不转换为 double 值，当任一值可能太大而无法完全适合另一种类型时

我有一个32位floatf我需要转换为32位无符号整数的数字(已知为正数)。它的大小可能太大而不适合。此外，下游计算需要一些净空。我可以计算最大可接受值m作为32位整数。如果f，我如何在受约束的32位机器(ARMM4F)上有效地确定C++11数学上。请注意，这两个值的类型不匹配。以下三种方法各有其问题:static_cast(f):我认为这会触发未定义的行为，如果f不适合32位整数f(m):如果m太大而无法准确转换，转换后的值可能大于m使得后续比较在某些边缘情况下会产生错误的结果static_cast(f)(m):在数学上是正确的，但需要强制转换为double并使用double，出于效

任一 amp code section float c++floating-point arm precision

c++ - 在不更改代码的情况下生成 NaN float 时停止调试器

我读了this和this.精髓是，如果通过包含fenv.h并通过feenableexcept(FE_ALL_EXCEPT&~FE_INEXACT);启用所有浮点异常但FE_INEXACT生成nan，则可以抛出SIGFPE;因此，代码改变了形式intmain(){doubledirty=0.0;doublenanvalue=0.0/dirty;return0;}到#includeintmain(){feenableexcept(FE_ALL_EXCEPT&~FE_INEXACT);//EnableallfloatingpointexceptionsbutFE_INEXACTdoubled

调试器 amp code section FE_INEXACT c++c nan sigfpe

c++ - 如何正确地将 float 与 int 相乘并获得仅受有效数字影响的结果？

我有代码在float(代表秒)和int64(代表纳秒)之间进行转换，从float中取6位小数int64_tnanos=f*1000000000LL;然而，存储在float中的许多十进制值无法在二进制float中准确表示，因此当我的float为14.2f时，我得到类似14199999488的结果。目前我通过计算小数点后的有效位数来解决这个问题constfloatlogOfSecs=std::log10(f);intprecommaPlaces=0;if(logOfSecs>0){precommaPlaces=std::ceil(logOfSecs);}intpostcommaPlaces

相乘 amp code section float c++floating-point multiplication

c++ - Boost Program_Options 抛出 "character conversion failed"

我在Ubuntu14.04上，使用CMake和CLion。我正在尝试使用程序选项，以下代码取自其文档中的示例:#include#includeintmain(intac,char*av[]){namespacepo=boost::program_options;usingnamespacestd;po::options_descriptiondesc("Allowedoptions");desc.add_options()("help","producehelpmessage")("compression",po::value(),"setcompressionlevel");po::

amp Program_Options code 34 section c++boost boost-program-options

java - 如何确认不同的结果是否是由于 float 处理的差异？

我已经将一个相对简单的算法从C++转换为Java，该算法对double类型的数字执行大量计算，但是在两个平台上运行该算法但同一台机器产生的结果略有不同结果。该算法对许多double和整数进行乘法和求和。我在Java算法中将int转换为double；C算法不强制转换。例如，在一次运行中我得到了结果:(Java)64684970(C++)65296408(打印忽略小数位)当然，我的算法可能存在错误，但是在我开始花时间调试之前，是否可以通过C++和Java中不同的浮点处理来解释这种差异？如果是这样，我可以证明这是问题所在吗？更新-类型不同的地方是两个整数之间的乘法，然后将其添加到运行总dou

是由 float section C++double java c++floating-point

c++ - 铿锵错误 : ambiguous conversion for static_cast

我有以下代码:typedefintAliasB;typedefunsignedshortAliasA;classAlias{public:explicitAlias(intsomeInt){}};//(*)!!belowbreakstheconversionpathviaAliasA!!//typedefAliasAliasA;classC{public:C(){}};classB{public:B(){}B(constAliasB&value){}operatorAliasB()const{return-1000;}Ccombine(constB&someB){returnC();}

static_cast conversion static return c++casting clang

c++ -++如何在大 float 上定义

这个问题在这里已经有了答案:maximumvalueinfloat(1个回答)关闭7年前。所以我一直在研究IEEE754浮点double。(我的C++编译器将该类型用于double)。考虑这个片段://9007199254740992isthe53rdpowerof2.//590295810358705700000isthe69thpowerof2.for(doublef=9007199254740992;f据推测，由于四舍五入，f以偶数步长递增到2的54次方？然后之后，由于向下舍入没有任何反应吗？这样对吗？它是否定义明确？

amp 43 section code notice c++ieee-754

c++ - 错误 : invalid conversion from 'void ()()' to 'void ()()' -- what?

我正在尝试将回调函数从C++传递到OpenGL(CAPI):gluQuadricCallback(qobj,GLU_ERROR,errorCallback);其中errorCallback是编译为C++代码的文件中的函数，声明为voiderrorCallback();代码在Linux上使用g++4.4编译干净，但在Windows上使用mingw32g++4.4时出现以下错误:..\glwidget.cpp:172:error:invalidconversionfrom'void(*)()'to'void(*)()'..\glwidget.cpp:172:error:initializi

amp 39 code GLAPIENTRY strong c++c opengl gcc function-pointers

c++ - 错误 C2678 : binary '=' : no operator found which takes a left-hand operand of type 'const Recipe' (or there is no acceptable conversion)

我正在尝试对每个元素中包含一个int和一个字符串的vector进行排序。它是一个称为vector食谱的类类型的vector。出现上述错误，这是我的代码:在我的Recipe.h文件中structRecipe{public:stringget_cname()const{returnchef_name;}private:intrecipe_id;stringchef_name;在我的Menu.cpp文件中voidMenu::show()const{sort(recipes.begin(),recipes.end(),Sort_by_cname());}在我的Menu.h文件中#include

amp 39 code section const c++class sorting vector

59 60 616263 64 65