草庐IT

long-double

全部标签

c# - 如何将 double 组从 C# 发送到 C++

在我的C#代码中,我有以下数组:varprices=new[]{1.1,1.2,1.3,4,5,};我需要将它作为参数传递给我的托管C++模块。vardiscountedPrices=MyManagedCpp.GetDiscountedPrices(prices);GetDiscountedPrices的签名应该是什么样的?在最简单的情况下,当折扣价等于价格时,C++方法GetDiscountedPrices应该是什么样子?编辑:我设法让它编译。我的C#代码是这样的:[Test]publicvoidtest3(){varprices=newValueType[]{1.1,1.2,1.3

c++ - 将 unsigned long long 与 signed long long 结果相减?

假设我有这两种类型:typedefunsignedlonglonguint64;typedefsignedlonglongsint64;我有这些变量:uint64a=...;uint64b=...;sint64c;我想从a中减去b并将结果赋给c,很明显,如果差值的绝对值大于2^63,那么它将换行(或未定义),这是可以的。但是对于绝对差小于2^63的情况,我希望结果是正确的。以下三种方式:c=a-b;//signconversionwarningignoredc=sint64(a-b);c=sint64(a)-sint64(b);其中哪些可以保证按标准工作?(以及为什么/如何?)

c++ - 添加 long 值显示不同的 o/p

我在添加长值时遇到问题例子typedefunsignedshortUINT16;UINT16*flash_dest_ptr;//thisisequaltoinhexa0XFF910000UINT16data_length;//hex=0x000002AA&dec=682//nowwhenIaddUINT16*memory_loc_ver=flash_dest_ptr+data_length;dbug_printf(DBUG_ERROR|DBUG_NAVD,"ADDhex=0x%08X\n\r",memory_loc_ver);实际O/p=0xFF910554//shouldn'to/p

c++ - 为什么 g++(4.6 和 4.7)将这个除法的结果提升为 double ?我能阻止吗?

我正在编写一些模板代码来对同时使用float和double的数值算法进行基准测试,以便与GPU实现进行比较。我发现我的浮点代码速度较慢,在调查使用Intel的VtuneAmplifier后,我发现g++正在生成额外的x86指令(cvtps2pd/cvtpd2ps和unpcklps/unpcklpd)以将一些中间结果从float转换为double然后再返回再次。此应用程序的性能下降了近10%。在使用标志-Wdouble-promotion编译后(顺便说一句,-Wall或-Wextra不包含),果然g++警告我结果正在提升。我将其简化为如下所示的简单测试用例。请注意,C++代码的顺序会影响

c++ - "double"的操作和 C 中的优化

我最近分析了一段用VS2005编译的旧代码,因为在“调试”(无优化)和“发布”(/O2/Oi/Ot选项)编译中存在不同的数值行为。(简化的)代码如下所示:voidf(doublex1,doubley1,doublex2,doubley2){doublea1,a2,d;a1=atan2(y1,x1);a2=atan2(y2,x2);d=a1-a2;if(d==0.0){//NOTE:Iknowthat==onrealsis"evil"!printf("EQUAL!\n");}函数f如果使用相同的值对调用(例如f(1,2,1,2)),则预计会打印“EQUAL”,但这并不总是发生在“发布”中

c++ - 在计算过程中将 int 类型转换为 long long 有什么好处?

我通过以下函数得到了错误的答案。vectorrepeatedNumber(constvector&A){intn=A.size();longlonglinear_sum=0,square_sum=0;inti=0;for(;ians;ans.push_back((linear_sum+square_sum)/2);ans.push_back((-linear_sum+square_sum)/2);returnans;}但是当我将LINE1和LINE2替换为:linear_sum+=(longlong)A[i];square_sum+=(longlong)A[i]*(longlong)A

c++ long double 精确打印所有数字

关于我的问题,我在这里看到了一篇帖子,但不明白,因为我是C++的新手。我写了一个小脚本,它从用户那里获取一个数字,脚本打印出输入数字的阶乘。一旦我输入更大的数字,如30,脚本不会打印出所有数字。输出就像2.652528598E+32但是我想要的是确切的数字265252859812191058636308480000000。有人可以解释如何以长double获取所有数字。提前致谢 最佳答案 您可以将输出流的精度设置为任何您想要的精度,以获得您想要的结果。http://www.cplusplus.com/reference/ios/ios

c++ - 简洁准确的 double 打印

我有一个doublex,我想将其打印为字符串s。我希望表示服从以下属性:准确:(x-atof(s))的绝对值小于epsilon简洁:表示不包含比准确要求更多的有效数字执行此操作的最佳方法是什么?为了说明为什么%f和%g没有完成这项工作:printf("%f\n",1.0);//1.000000notconciseprintf("%g\n",1.0);//1goodprintf("%f\n",4357890.2342389);//4357890.234239goodprintf("%g\n",4357890.2342389);//4.35789e+06notaccurate

c++ - 如何在 Qt 中打印所有小数点的 double 值?

首先,这不是重复的。我在网上搜索过,但没有足够的答案。我想打印一个double。所以我必须将它转换为QString。我想要没有科学计数法,0.1应该打印0.1和1/3应该打印尽可能多的0.33333...double能够表示。不幸的是,我只能找到具有固定精度的解决方案,这会导致上限为0.333333(在指定的p松动精度后结束)或不必要的零填充0.100000。我知道我可以最大化精度并删除所有尾随零,但是否有一个很好的解决方案,它只打印最大可能但最小必要精度?编辑:我想我需要澄清一些事情。这道题不是要将实数空间映射成单精度、double或任何精度的float。它是关于逆向的:将64位do

c++ - 深度神经网络的图像识别精度,float 还是 double?

用于图像识别的神经网络可能非常庞大。可以有数千个输入/隐藏神经元,数百万个连接什么的会占用大量计算机资源。同时float通常是32位和doublec++64位,它们在速度上没有太大的性能差异,但使用float可以节省一些内存。有一个神经网络正在使用什么sigmoid作为激活函数,如果我们可以选择神经网络中的哪些变量可以是float或double哪个可以float以节省内存而不会使神经网络无法执行?虽然训练/测试数据的输入和输出绝对可以是float因为它们不需要double,因为图像中的颜色可以仅在0-255范围内,当归一化为0.0-1.0比例时,单位值为1/255=0.0039~1。隐