K128_草庐IT

c++ - __int128 @ 最小负值的 UDL(用户定义文字)整数溢出

为了清楚和简单起见，我将缩短以下数字:−170,141,183,460,469,231,731,687,303,715,884,105,728为-170…728170,141,183,460,469,231,731,687,303,715,884,105,727为170…727这些数字表示128位有符号整数(gcc中的__int128)的最小值和最大值。我为这种数据类型实现了用户定义的文字(原始文字)，因为gcc不提供定义这种类型常量的方法:_u128forunsigned__int128和_i128为__int128。减号不是UDL的一部分，而是应用于UDL结果的一元减号运算符。因此

负值 amp code 128 section c++c++11 integer-overflow user-defined-literals int128

c++ - 如何将 std::hex 用于我的自定义 uint128 类型？

重载(或实际是什么)std::hex的正确语法是什么，以便它的功能可以扩展到非标准整数？我写了这个版本的uint128_t 最佳答案 std::hex只是一个在流上设置一些格式化标志的操纵器。您可以使用ios_base::flags()获取它们并在您的operator如果您想要的设置比提供的更多，ios_base::xalloc、ios_base::iword、ios_base::pword为您的操纵器和插入器提供扩展路径。关于c++-如何将std::hex用于我的自定义uint128

自定 amp section ios_base base c++hex

c++ - 如何反转 __m128 类型变量？

我知道这应该是一个谷歌搜索问题，但我就是找不到答案。假设我有一个__m128变量a，它的内容是a[0]，a[1]，a[2]，a[3]。是否有单个函数可以将其反转为a[3]、a[2]、a[1]，a[0]？最佳答案使用_mm_shuffle_ps().该指令已在SSE中可用，并且可以通过组合来自两个输入vector中的每一个的任意32位分量，将4个32位分量收集到一个vector中。如何使用宏_MM_SHUFFLE()创建掩码宏定义如下:/*CreateaselectorforusewiththeSHUFPSinstruction.

反转 amp code section strong c++c x86 sse simd

c++ - 如何在不使用任何 SSE 指令的情况下设置 __m128i？

我有很多函数使用相同的常量__m128i值。例如:const__m128iK8=_mm_setr_epi8(1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16);const__m128iK16=_mm_setr_epi16(1,2,3,4,5,6,7,8);const__m128iK32=_mm_setr_epi32(1,2,3,4);所以我想将所有这些常量存储在一个地方。但是有一个问题:我在运行时检查现有的CPU扩展。如果CPU不支持例如SSE(或AVX)，那么在常量初始化期间程序将崩溃。那么是否可以在不使用SSE的情况下初始化这些常量？

何在 amp CHAR LONGLONG AS c++constants sse simd sse2

c++ - gcc 的 __float128 float 是否考虑了当前的舍入模式？

gcc的__float128float的算术运算是否考虑了当前的舍入模式？例如，如果使用C++11函数std::fesetenv，我将舍入模式更改为FE_DOWNWARD，将对进行算术运算的结果__float128向下舍入？这是否由__float128规范保证？最佳答案我相信保证__float128上的操作考虑了舍入模式。根据GNUC库文档，浮点计算遵循舍入模式。根据GCC手册__float128是一个支持除法等算术运算的浮点类型。据此我推断，对于__float128的操作，必须考虑舍入模式。GNUC库文档指出:20.6Roun

float amp code strong c++c++11 gcc floating-point

c++ - __mm128 的 vector 不会 push_back()

这个简单的SSE代码:#include#includeintmain(){std::vectorblah;blah.push_back(__m128());}在MSVC10上崩溃并在0xffffffff处出现段错误。可能出了什么问题？最佳答案 std::vector不分配特殊对齐的内存，__m128需要用它来存储它的数据。您将不得不换出分配器，或者将其替换为4个float的数组，然后在每次访问vector时执行未对齐的加载或复制到对齐的位置。关于c++-__mm128的vector不

amp push_back section code vector c++visual-c++sse

C++ 128/256 位固定大小整数类型

我想知道是否有任何SO伙伴可以推荐一个好的轻量级固定大小整数类型(128位甚至256位，甚至可能是模板参数化)库。我看过GMP和co，他们非常关心，但对于我的目的来说有点太大了，此时我对简单的仅header解决方案感兴趣。性能很重要，目标架构将是x86和x86-64，也是一个合理的许可证(也不是GPL或LGPL)。最佳答案 Boost库的数据类型是multiprecision的一部分库，适用于128到1024位的类型。#includeusingnamespaceboost::multiprecision;int128_tmySig

amp 43 section multiprecision myUnsignedInt c++types bigint

c++ - 通过 union 合法访问 __m128 变量的字节吗？

考虑这个变量声明:union{struct{floatx,y,z,padding;}components;__m128sse;}_data;我的思路是通过x,y,z字段赋值，进行SSE2计算，通过读取结果x、y、z。不过，我有点怀疑它是否合法。我关心的是对齐:MSDN说__m128变量自动对齐到16字节边界，我想知道我的union是否可以打破这种行为。这里还有其他陷阱需要考虑吗？最佳答案 union的对齐应该没问题，但在Windows的情况下，您可以直接访问32位组件。来自xmmintrin.h(DirectXMath):type

amp 合法 code section 128 c++sse unions

c++ - 使用 SIMD 指令执行任意 128/256/512 位排列的最快方法是什么？

我想在宽度为128、256或512位的CPU寄存器(xmm、ymm或zmm)上执行单个位、位对和半字节(4位)的任意排列；这应该尽可能快。为此，我正在研究SIMD指令。有谁知道执行此操作的方法/实现它的库？我在Windows上使用MSVC，在Linux上使用GCC，宿主语言是C或C++。谢谢!我得到了一个任意排列，需要打乱大量的位vector/位vector对/半字节。我知道如何为64位值中的位执行此操作，例如usingaBenesnetwork.或者在更宽的SIMD寄存器上混洗8位和更大的block，例如将AgnerFog的GPLedVectorClass库(https://www.

amp 最快 256 code pos c++assembly sse avx avx2

c++ - 如何创建 128 位整数文字？

我有一个整数文字，格式为0x75f17d6b3588f843b13dea7c9c324e51。有没有办法避免编译器语法错误“整数文字太大，无法用任何整数类型表示”？因为我知道我可以使用这些类型(我正在使用EOS库中的uint128_t，如果我手动插入它，它就可以工作)。有没有办法在运行时以某种方式将这个字符串直接解析为完全相同的整数？最佳答案您可以为128位整数编写userdefinedliteral(C++11起)。原始文字运算符采用单个constchar*作为参数。您可以编写一个函数体来解析字符串。例如://Use__uin

amp 43 code section 39 c++literals int128