256

c++ - Visual Studio C 编译器或 Intel Intrinsics 的 AVX2 "_mm256_set_epi64x"函数中的潜在错误

我在AVX2函数上遇到了IntelIntrinsics的一个非常奇怪的错误，我想在这里分享。要么是我做错了什么(此时我真的看不出是什么)，要么是库中的错误。我的main.c中有这个简单的代码:__int64test=0xFFFF'FFFF'FFFF'FFFF;__m256iymm=_mm256_set_epi64x(0x0000'0000'0000'0000,0x0000'0000'0000'0000,0x0000'0000'0000'0000,test);分配给变量ymm的值是出于某些奇怪的原因:ymm.m256i_i64[0]=0xffff'ffff'ffff'ffffymm.m2

amp Intrinsics 0000 39 code c++visual-studio avx compiler-bug

c++ - 在 C++ 中计算 sha-256 的一个很好的库

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题，以便用事实和引用来回答。关闭2年前。Improvethisquestion我正试图找到一个用于计算sha256的好库。我已经找到了很多选择加密++:http://www.cryptopp.com/openSSL:http://www.openssl.org/奇迹:http://www.shamus.ie/我更喜欢一个众所周知的、工业上广泛使用的、适用于所有操作系统的库，而不是最高效的库。你有什么推荐给我的？(随意推荐我在这里没有提到的库)。

amp 中计 section noreferrer noopener c++sha256

c++ - 如何实现高效的_mm256_madd_epi8？

英特尔提供了一个名为_mm256_madd_epi16的C样式函数，该函数基本上__m256i_mm256_madd_epi16(__m256ia,__m256ib)Multiplypackedsigned16-bitintegersinaandb,producingintermediatesigned32-bitintegers.Horizontallyaddadjacentpairsofintermediate32-bitintegers,andpacktheresultsindst.现在，我有两个__m256i变量，每个变量中都有32个8位int。我想实现与_mm256_madd

amp madd_epi code 256 br c++x86 simd intrinsics avx2

c++ - g++-4.8 中缺少 AVX 日志内在函数 (_mm256_log_ps)？

我试图在我的代码中使用一些AVX内在函数，但遇到了对数内在函数的障碍。使用适用于Linux的IntelIntrinsicsGuidev3.0.1，我看到内在_mm256_log_ps(__m256)被列为“immintrin.h”的一部分，并且在我当前的arch上也受支持。然而，尝试编译这个简单的测试用例失败并显示“错误:‘_mm256_log_ps’未在此范围内声明”这个例子是用g++-4.8-march=native-mavxtest.cpp编译的#includeintmain(){__m256i;_mm256_log_ps(i);}我是否遗漏了一些基本的东西？某些内在函数是否不受

amp 43 code 内在英特 c++g++intrinsics avx

c++ - 递归模板实例化超过最大深度 256

我试图使用constexpr函数重写Factorial实现，但出于某种原因我不知道为什么会出现编译错误:recursivetemplateinstantiationexceededmaximumdepthof256实际上我知道错误消息的含义，但我不知道的是为什么我会收到此错误以及为什么使用struct的代码1有效但第二个using函数无效。它们有什么区别？//yes,Iknowitdoesn'treturnthefactorialvalue.FirstIwanttomakeitcompiletemplateconstexprintf2(){returnN==0?1:f2();}temp

amp 43 code section Factorial c++templates c++11 recursion clang

c++ - 打包和解交错两个 __m256 寄存器

我有一个按行排列的float组(~20列x~1M行)，我需要从中一次提取两列到两个__m256寄存器中。...a0.........b0.........a1.........b1......//......a7.........b7......//endfirst__m256一个简单的方法是__m256ivindex=_mm256_setr_epi32(0,1*stride,2*stride,//...7*stride);__m256colA=_mm256_i32gather_ps(baseAddrColA,vindex,sizeof(float));__m256colB=_mm25

寄存交错 256 code shuffled c++x86 simd avx avx2

C++ 128/256 位固定大小整数类型

我想知道是否有任何SO伙伴可以推荐一个好的轻量级固定大小整数类型(128位甚至256位，甚至可能是模板参数化)库。我看过GMP和co，他们非常关心，但对于我的目的来说有点太大了，此时我对简单的仅header解决方案感兴趣。性能很重要，目标架构将是x86和x86-64，也是一个合理的许可证(也不是GPL或LGPL)。最佳答案 Boost库的数据类型是multiprecision的一部分库，适用于128到1024位的类型。#includeusingnamespaceboost::multiprecision;int128_tmySig

amp 43 section multiprecision myUnsignedInt c++types bigint

c++ - 使用 SIMD 指令执行任意 128/256/512 位排列的最快方法是什么？

我想在宽度为128、256或512位的CPU寄存器(xmm、ymm或zmm)上执行单个位、位对和半字节(4位)的任意排列；这应该尽可能快。为此，我正在研究SIMD指令。有谁知道执行此操作的方法/实现它的库？我在Windows上使用MSVC，在Linux上使用GCC，宿主语言是C或C++。谢谢!我得到了一个任意排列，需要打乱大量的位vector/位vector对/半字节。我知道如何为64位值中的位执行此操作，例如usingaBenesnetwork.或者在更宽的SIMD寄存器上混洗8位和更大的block，例如将AgnerFog的GPLedVectorClass库(https://www.

amp 最快 256 code pos c++assembly sse avx avx2

windows - 如何在 Windows 7 上使用 SHA256 设置签名工具？

多年来我一直使用SHA1签名，但从2016年开始，Windows强制开发人员使用SHA256。WindowsEnforcementofAuthenticodeCodeSigningandTimestamping通过使用Windows7SDK签名工具，对SHA-256进行签名的功能是“未知命令”，因此此签名工具作为签名工具已过时，不应再使用。为了使用SHA256进行签名，我下载了Windows8.1SDK以获取signtool.exe，它获得了新功能(/fd和其他一些功能)。BAT文件和signtool可以在Windows8和10上运行，所以我知道它可以运行，但在尝试为文件添加时间戳时在

何在 windows section noreferrer sha256 signtool authenticode

windows - 如何在路径长度大于256的Windows中创建目录

我在文件夹路径中有几级目录。当路径超过256时，我无法从中创建子文件夹或文件。是否有机会构建超过此长度的路径。谁能帮帮我。最佳答案事实上，路径字符串的限制是260个字符。如今，底层操作系统可以支持更长的路径名，upto32,767characters.为了用长名称命名路径，您需要使用神奇的\\?\前缀，并使用API的Unicode版本。但是，许多工具不支持这么长的名称。此类工具的典型示例是Explorer，它不允许您创建名称超过260个字符的对象。正因为如此，我强烈建议您避免创建这么长的名称——从长远来看，这样做会让您省去很多心

何在 windows section stackoverflow 建子 path directory

38 39 404142 43 44