floating-point-precision

c++ - 具有 double 、 float 和整数数据类型的英特尔 MKL 矩阵产品性能

我正在试验英特尔MKL库，使用它们提供的Boost::uBLAS接口(interface)(包括mkl_boost_ublas_matrix_prod.hpp)执行矩阵乘法。我的数据只是整数，所以我尝试将我的矩阵模板类型更改为int并且性能下降，这似乎主要是由于代码仅使用单个CPU内核而不是我可用的12个。我在MKL文档中找不到任何内容来解释为什么整数没有使用MKL的OpenMP多线程功能(我猜他们根本没有使用MKL？)。此外，与float相比，我发现double的性能下降了50%。问题:为什么float和double之间存在差异？为什么我不能使用整数？这是我从下面的代码中得到的结果:

c++ - 写 foo(const float&) 是在浪费精力吗？

当传递像int或float这样的原始类型时，这样写是不是浪费了精力:foo(constfloat&);而不只是按值传递:foo(float); 最佳答案为了花车？Yes,prettymuch.这里根本没有任何好处:float很小，复制不会比创建指针来实现引用慢。关于c++-写foo(constfloat&)是在浪费精力吗？，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questions/210

amp const section float stackoverflow c++

c++ - Node C++ 插件 - 当类型化数组 (Float32Array) 作为参数传递时，如何访问它？

我想使用V8Float32Array数据结构。我该如何初始化它？我也对直接内存访问数据感兴趣。这怎么可能？最佳答案已更新现在最好的方法是使用助手Nan::TypedArrayContents.assert(args[i]->IsFloat32Array());Localmyarr=args[i].As();Nan::TypedArrayContentsdest(myarr);//Nowusedest,e.g.(*dest)[0]node-canvas中有一个很好的例子.原始答案，显示了帮助程序为何有用v8API现在变化很快，所以

amp 类型化 code section Array c++node.js node.js-addon

c++ - 模板代码中的 float 或 double

下面的例子可能看起来很荒谬，但它是一个更大的高性能代码的一部分，在这个代码中所介绍的技术是有意义的。我提到这一点是为了防止有人怀疑XY问题——很可能不是。我有一个带有模板化/编译时操作数的函数:templateintmul(intx){returnM*x;}现在我想对double做同样的事情，这是-当然-不允许的:template//youcan'tdothat!intmul(doublex){returnM*x;}所以为了在编译时仍然放入double，我只看到以下解决方案://createmyconstantsstructSevenPointFive{staticconstexprd

amp double code section c++templates constexpr

c++ - AVX/SSE 回合向下 float 并返回整数 vector ？

有没有办法使用AVX/SSE获取浮点vector、向下舍入并生成整数vector？所有的floor内部方法似乎都产生了一个浮点的最终vector，这很奇怪，因为四舍五入产生了一个整数! 最佳答案 SSE可以从FP转换为整数，您可以选择截断(向零)或当前舍入模式(通常是IEEE默认模式，最接近平局舍入为偶数。像nearbyint()，与round()不同，其中tiebreak是远离0。如果您需要x86上的舍入模式，youhavetoemulateit,perhapswithtruncateasabuildingblock。)相关说明为

回合 amp code result vector c++intel sse intrinsics avx

c++ - C++向chrono::system_clock::time_point添加月份

如何将chrono::system_clock::time_point值加数月？谢谢! 最佳答案概述这是一个非常有趣的问题，有几个答案。“正确”的答案是您必须针对特定应用程序决定的。使用月份，您可以选择按时间顺序进行计算或进行日历计算。按时间顺序的计算处理时间点和持续时间的常规单位，例如小时，分钟和秒。日历计算处理不规则的日历，该日历主要用来给日子起令人难忘的名字。年表计算如果问题是关于future几个月的物理过程，那么物理学并不关心不同的月份有不同的长度，因此按时间顺序计算就足够了:婴儿要在9个月内到期。从现在开始的6个月后，这

amp 43 code br time c++c++11 std chrono

c++ - std::scientific 是否总是导致 float 的规范化科学计数法？

科学记数法定义了数字应该如何使用符号、数字和指数来显示，但它没有声明可视化是标准化的。一个例子:-2.34e-2(归一化科学计数法)与-0.234e-1(科学计数法)相同我能否依赖以下代码始终生成规范化结果？编辑:答案中指出的NAN和INF除外。templatestaticstd::stringtoScientificNotation(Tnumber,unsignedsignificantDigits){if(significantDigits>0){significantDigits--;}std::stringstreamss;ss.precision(significantDig

计数法 scientific code section c++floating-point scientific-notation

c++ - 来自 Voronoi 的 Delaunay boost : missing triangle with non-integral point coordinates

遵循这两个资源:BoostbasictutorialSOQuestion我用boost写了一个Delaunay三角剖分。如果点坐标是完整的(我生成了几个随机测试并且我没有观察到错误)，它工作正常。但是，如果这些点不是整数，我会发现许多不正确的三角剖分缺少边缘或错误的边缘。例如这张图片是用四舍五入的值构建的并且是正确的(见下面的代码)但是这个图像是用原始值构建的并且是不正确的(见下面的代码)这段代码重现了这两个例子(没有显示)。#includeusingboost::polygon::voronoi_builder;usingboost::polygon::voronoi_diagram

non-integral coordinates lt triangle double c++boost voronoi delaunay boost-polygon

c++ - 最准确的线相交坐标计算与 float ？

我在给定横坐标x处计算直线上一点的纵坐标y。该线由其两个端点坐标(x0,y0)(x1,y1)定义。端点坐标是float，必须以浮点精度进行计算才能在GPU中使用。数学和天真的实现都是微不足道的。设t=(x-x0)/(x1-x0)，则y=(1-t)*y0+t*y1=y0+t*(y1-y0)。问题出在x1-x0很小的时候。结果将引入取消错误。当与x-x0中的一个结合时，在除法中我预计t会出现重大错误。问题是是否存在另一种更准确地确定y的方法？即我应该先计算(x-x0)*(y1-y0)，然后除以(x1-x0)吗？y1-y0的差异总是很大。最佳答案

amp float section 的 x0 c++c optimization math numerical

c++ - 在设备上的线性内存中循环二维数组时将 float* 转换为 char*

在CUDA4.0编程指南的第21页有一个示例(下面给出)来说明循环遍历设备内存中二维float组的元素。2D的尺寸是width*height//Hostcodeintwidth=64,height=64;float*devPtr;size_tpitch;cudaMallocPitch(&devPtr,&pitch,width*sizeof(float),height);MyKernel>>(devPtr,pitch,width,height);//Devicecode__global__voidMyKernel(float*devPtr,size_tpitch,intwidth,int

amp float code devPtr c++pointers cuda

41 42 434445 46 47