草庐IT

c++ - x86 上两个 128 位整数的高效乘法/除法(无 64 位)

编译器:MinGW/GCC问题:不允许使用GPL/LGPL代码(GMP或任何bignum库对于这个问题来说都太过分了,因为我已经实现了该类)。我构建了自己的128位固定大小的大整数类(旨在用于游戏引擎,但可以推广到任何用例)并且我发现当前乘法的性能并且除法操作非常糟糕(是的,我已经对它们进行了计时,见下文),并且我想改进(或更改)执行低级数字运算的算法。当谈到乘法和除法运算符时,与类里面的几乎所有其他运算符相比,它们的速度慢得令人无法忍受。这些是相对于我自己的计算机的近似测量值:RawtimesasdefinedbyQueryPerformanceFrequency:1/60sec31

c++ - 如何指示编译器为 __m128 生成未对齐的加载

我有一些代码可以使用__m128值。我在这些值上使用x86-64SSE内在函数,我发现如果这些值在内存中未对齐,我会崩溃。这是由于我的编译器(在本例中为clang)仅生成对齐的加载指令。我能否指示我的编译器生成未对齐的加载,无论是全局加载还是针对某些值(可能带有某种注释)?首先我有未对齐值的原因是我试图节省内存。我有一个struct大致如下:#pragmapack(push,4)structFoobar{__m128a;__m128b;intc;};#pragmapack(pop)然后我将创建这些结构的数组。数组中的第二个元素从36字节开始,不是16的倍数。我知道我可以切换到数组表示的

已知 IP 地址是 128.14.35.7/20。求网络地址

首先知道公式然后我们由128得出这个是B类IP地址默认是16位1但是所给IP已经给了掩码长度所以求出了就知道掩码就可以求出了

c++ - 从 64 位无符号整数初始化 __m128 类型

_mm_set_epi64和类似的*_epi64指令似乎使用并依赖于__m64类型。我想初始化一个__m128类型的变量,使其高64位为0,低64位设为x,其中x是uint64_t类型(或类似的无符号64位类型)。这样做的“正确”方法是什么?最好,这应该以独立于编译器的方式完成。 最佳答案 回答有关如何将64位值加载到XMM寄存器的低64位同时将高64位清零的问题_mm_loadl_epi64(&x)willdoexactlywhatyouwant.关于_mm_set_epi64我曾说过,查看AgnerFog的源代码VectorCl

c++ - 检查所有 __m128i 组件是否为 0 的最有效方法 [使用 <= SSE4.1 内在函数]

我正在使用SSE内在函数来确定矩形(由四个int32值定义)是否已更改:__m128ioldRect;//containsoldleft,top,right,bottompackedto128bits__m128inewRect;//containsnewleft,top,right,bottompackedto128bits__m128ixor=_mm_xor_si128(oldRect,newRect);此时,如果矩形未更改,生成的xor值将全为零。那么确定这一点的最有效方法是什么?目前我正在这样做:if(xor.m128i_u64[0]|xor.m128i_u64[1]){//r

c++ - 为什么gcc/clang要用两个128bit的xmm寄存器来传递一个值?

所以我偶然发现了一些我想了解的东西,因为它让我头疼。我有以下代码:#include#includetypedefunion{struct{floatx,y,z,w;}v;__m128m;}vec;vec__attribute__((noinline))square(veca){vecx={.m=_mm_mul_ps(a.m,a.m)};returnx;}intmain(intargc,char*argv[]){floatf=4.9;veca=(vec){f,f,f,f};vecres=square(a);//?printf("%f%f%f%f\n",res.v.x,res.v.y,re

c++ - __m128i 变量是否为零?

如何测试__m128i变量在SSE-2和更早版本的处理器上是否具有任何非零值? 最佳答案 在SSE2中你可以做:__m128izero=_mm_setzero_si128();if(_mm_movemask_epi8(_mm_cmpeq_epi32(x,zero))==0xFFFF){//thecode...}这将测试四个int与零然后为每个字节返回一个掩码,因此每个相应的int的位偏移将在0、4、8和12,但上面的测试将如果设置了任何位,则捕获,然后如果您保留掩码,则可以在需要时直接使用更细粒度的部分。

c++ - 为什么 decimal128 可能会被标准化而 quad precision 不会?

这是一个非常幼稚的问题。如果我们看看C和C++标准委员会,他们目前正在致力于添加十进制浮点标准类型:linktotheCproposallinktotheC++proposal所以看起来我们可能会有一个标准化的decimal128类型,而我们还没有任何标准化的binary128类型(四精度而不是简单的扩展double)。这种情况是有技术原因还是纯粹是“政治”? 最佳答案 四精度二进制float不能替代十进制类型。精度问题仅次于十进制数的表示。这个想法是在语言中添加一种类型来支持像0.1这样的数字表示,而不会损失任何精度——这是二进制

c - 快速计算 __m128i 寄存器中设置位的数量

我应该计算__m128i寄存器的设置位数。特别是,我应该使用以下方法编写两个能够计算寄存器位数的函数。寄存器的设置位总数。寄存器每个字节的设置位数。是否存在可以全部或部分执行上述操作的内在函数? 最佳答案 以下是我在旧项目(thereisaresearchpaperaboutit)中使用的一些代码。下面的函数popcnt8计算每个字节中设置的位数。仅SSE2版本(基于Hacker'sDelightbook中的算法3):staticconst__m128ipopcount_mask1=_mm_set1_epi8(0x77);stati

c++ - 为什么在 g++ std::intmax_t 中不是 __int128_t?

我的问题很简单:因为std::intmax_t根据cppreference定义为maximumwidthintegertype,为什么不对应GCC中的__int128_t? 最佳答案 我认为这违反了C和C++标准——或者gcc不考虑__int128_t是一个整数类型。C标准(1999版和2011版)不需要intmax_t成为标准类型之一;它必须是“能够表示任何有符号整数类型的任何值的有符号整数类型”。特别是,它可以是一个扩展整数类型——如果有一个128位扩展整数类型,那么intmax_t必须至少为128位宽。C标准甚至建议使用实现定