08.128

c++ - x86 上两个 128 位整数的高效乘法/除法(无 64 位)

编译器:MinGW/GCC问题:不允许使用GPL/LGPL代码(GMP或任何bignum库对于这个问题来说都太过分了，因为我已经实现了该类)。我构建了自己的128位固定大小的大整数类(旨在用于游戏引擎，但可以推广到任何用例)并且我发现当前乘法的性能并且除法操作非常糟糕(是的，我已经对它们进行了计时，见下文)，并且我想改进(或更改)执行低级数字运算的算法。当谈到乘法和除法运算符时，与类里面的几乎所有其他运算符相比，它们的速度慢得令人无法忍受。这些是相对于我自己的计算机的近似测量值:RawtimesasdefinedbyQueryPerformanceFrequency:1/60sec31

amp 43 strong dw mask c++algorithm x86 bignum

c++ - 如何指示编译器为 __m128 生成未对齐的加载

我有一些代码可以使用__m128值。我在这些值上使用x86-64SSE内在函数，我发现如果这些值在内存中未对齐，我会崩溃。这是由于我的编译器(在本例中为clang)仅生成对齐的加载指令。我能否指示我的编译器生成未对齐的加载，无论是全局加载还是针对某些值(可能带有某种注释)？首先我有未对齐值的原因是我试图节省内存。我有一个struct大致如下:#pragmapack(push,4)structFoobar{__m128a;__m128b;intc;};#pragmapack(pop)然后我将创建这些结构的数组。数组中的第二个元素从36字节开始，不是16的倍数。我知道我可以切换到数组表示的

amp 43 Vector4 code Vector c++x86-64 sse simd intrinsics

已知 IP 地址是 128.14.35.7/20。求网络地址

首先知道公式然后我们由128得出这个是B类IP地址默认是16位1但是所给IP已经给了掩码长度所以求出了就知道掩码就可以求出了

地址已知求出知道 svg 计算机网络

c++ - 从 64 位无符号整数初始化 __m128 类型

_mm_set_epi64和类似的*_epi64指令似乎使用并依赖于__m64类型。我想初始化一个__m128类型的变量，使其高64位为0，低64位设为x，其中x是uint64_t类型(或类似的无符号64位类型)。这样做的“正确”方法是什么？最好，这应该以独立于编译器的方式完成。最佳答案回答有关如何将64位值加载到XMM寄存器的低64位同时将高64位清零的问题_mm_loadl_epi64(&x)willdoexactlywhatyouwant.关于_mm_set_epi64我曾说过，查看AgnerFog的源代码VectorCl

amp 43 code 64 section c++sse intrinsics

c++ - 检查所有 __m128i 组件是否为 0 的最有效方法 [使用 <= SSE4.1 内在函数]

我正在使用SSE内在函数来确定矩形(由四个int32值定义)是否已更改:__m128ioldRect;//containsoldleft,top,right,bottompackedto128bits__m128inewRect;//containsnewleft,top,right,bottompackedto128bits__m128ixor=_mm_xor_si128(oldRect,newRect);此时，如果矩形未更改，生成的xor值将全为零。那么确定这一点的最有效方法是什么？目前我正在这样做:if(xor.m128i_u64[0]|xor.m128i_u64[1]){//r

amp 内在 code section 128 c++integer sse simd intrinsics

c++ - 为什么gcc/clang要用两个128bit的xmm寄存器来传递一个值？

所以我偶然发现了一些我想了解的东西，因为它让我头疼。我有以下代码:#include#includetypedefunion{struct{floatx,y,z,w;}v;__m128m;}vec;vec__attribute__((noinline))square(veca){vecx={.m=_mm_mul_ps(a.m,a.m)};returnx;}intmain(intargc,char*argv[]){floatf=4.9;veca=(vec){f,f,f,f};vecres=square(a);//?printf("%f%f%f%f\n",res.v.x,res.v.y,re

寄存 amp code section c++c assembly clang sse

c++ - __m128i 变量是否为零？

如何测试__m128i变量在SSE-2和更早版本的处理器上是否具有任何非零值？最佳答案在SSE2中你可以做:__m128izero=_mm_setzero_si128();if(_mm_movemask_epi8(_mm_cmpeq_epi32(x,zero))==0xFFFF){//thecode...}这将测试四个int与零然后为每个字节返回一个掩码，因此每个相应的int的位偏移将在0、4、8和12，但上面的测试将如果设置了任何位，则捕获，然后如果您保留掩码，则可以在需要时直接使用更细粒度的部分。

amp 43 section code stackoverflow c++c intel sse simd

c++ - 为什么 decimal128 可能会被标准化而 quad precision 不会？

这是一个非常幼稚的问题。如果我们看看C和C++标准委员会，他们目前正在致力于添加十进制浮点标准类型:linktotheCproposallinktotheC++proposal所以看起来我们可能会有一个标准化的decimal128类型，而我们还没有任何标准化的binary128类型(四精度而不是简单的扩展double)。这种情况是有技术原因还是纯粹是“政治”？最佳答案四精度二进制float不能替代十进制类型。精度问题仅次于十进制数的表示。这个想法是在语言中添加一种类型来支持像0.1这样的数字表示，而不会损失任何精度——这是二进制

amp precision section decimal 十进 c++c c++11 floating-point standards

c - 快速计算 __m128i 寄存器中设置位的数量

我应该计算__m128i寄存器的设置位数。特别是，我应该使用以下方法编写两个能够计算寄存器位数的函数。寄存器的设置位总数。寄存器每个字节的设置位数。是否存在可以全部或部分执行上述操作的内在函数？最佳答案以下是我在旧项目(thereisaresearchpaperaboutit)中使用的一些代码。下面的函数popcnt8计算每个字节中设置的位数。仅SSE2版本(基于Hacker'sDelightbook中的算法3):staticconst__m128ipopcount_mask1=_mm_set1_epi8(0x77);stati

中设寄存 128 popcount code c sse simd sse2 hammingweight

c++ - 为什么在 g++ std::intmax_t 中不是 __int128_t？

我的问题很简单:因为std::intmax_t根据cppreference定义为maximumwidthintegertype，为什么不对应GCC中的__int128_t？最佳答案我认为这违反了C和C++标准——或者gcc不考虑__int128_t是一个整数类型。C标准(1999版和2011版)不需要intmax_t成为标准类型之一；它必须是“能够表示任何有符号整数类型的任何值的有符号整数类型”。特别是，它可以是一个扩展整数类型——如果有一个128位扩展整数类型，那么intmax_t必须至少为128位宽。C标准甚至建议使用实现定

amp 43 code 128 intmax_t c++c gcc integer standards

16 17 181920 21 22