avx512_草庐IT

c - 运行任何英特尔 AVX 函数后，数学函数需要更多周期

这个问题在这里已经有了答案:UsingAVXinstructionsdisablesexp()optimization?(1个回答)关闭8年前。我注意到数学函数(如ceil、round等)在运行任何英特尔AVX函数后需要更多的CPU周期。请看下面的例子:#include#include#includestaticunsignedlongintget_rdtsc(void){unsignedinta,d;asmvolatile("rdtsc":"=a"(a),"=d"(d));return(((unsignedlongint)a)|(((unsignedlongint)d)编译:gcc-

英特 AVX section round unsigned c linux gcc intel

windows - 通用调用约定如何处理 AVX 寄存器？

我找不到任何定义调用者和被调用者如何处理YMM寄存器的文档。为了突出我的问题，这里是我想知道的:在返回给调用者之前，被调用者必须恢复哪些YMM寄存器？由于Linux和Windows中的XMM寄存器存在差异，我假设YMM寄存器也不遵循相同的规则。每个操作系统的规则是什么？编辑:感谢下面的答案，我能够在提到的Win64文档中找到答案。我很确定Linux遵循类似的规则:"...TheYMMregistersdonothavecallee-savestatus,exceptforthelowerhalfofYMM6-YMM15in64-bitWindows,whereXMM6-XMM15hav

寄存何处 section C++windows linux calling-convention avx

c++ - 如何在 Linux 上用 C++ 计算 SHA-512 哈希值？

是否有可用于在Linux上计算SHA-512哈希值的标准库或常用库？我正在寻找C或C++库。最佳答案你检查过了吗OpenSSL.我自己没有使用过它，但文档说它支持它。这是fewmoreimplementations.的列表示例代码md=EVP_get_digestbyname("sha512");EVP_MD_CTX_init(&mdctx);EVP_DigestInit_ex(&mdctx,md,NULL);EVP_DigestUpdate(&mdctx,mess1,strlen(mess1));EVP_DigestUpdat

amp 上用 section mdctx c++c linux hash sha512

linux - 如何判断Linux机器是否支持AVX/AVX2指令？

我在SUSELinuxEnterprise10/11机器上。我开始对运行英特尔处理器的机器农场进行回归。我的一些测试失败了，因为我的工具是使用需要AVX/AVX2指令支持的库构建的。我收到一个Illegalexception错误。在Linux中，是否有任何命令可以用来确定CPU代码/系列名称是什么？我相信AVX和AVX2分别从IntelSandyBridge和Haswell系列开始提供。最佳答案运行这个命令:grepavx/proc/cpuinfo或者grepavx2/proc/cpuinfo这会给你:flags:fpuvmed

AVX linux section code unix suse avx2

php - PHP 的 SHA-512 库

我正在搜索任何提供SHA-512哈希的加密库。谷歌搜索我发现了一些，但SHA-512不存在。请提出建议。最佳答案如果您使用的是PHP>=5.3，函数openssl_digest应该可以解决问题:echoopenssl_digest('glop','sha512');给我这个输出(分成两行以获得更好的可读性):416b1861951170e1f6eb6543b0dd3d4f1994ce8da7cd82061513d3ddd1dd81111f4ada5caf6421f1d17425c6f29bdb4a95cf84df9eda4164

php code section noreferrer sha2

PHPExcel 耗尽 256、512 和 1024MB RAM

我不明白。XSLX表大约有3MB大，但即使是1024MB的RAM也不足以让PHPExcel将其加载到内存中吗？我这里可能做错了什么:functionReadXlsxTableIntoArray($theFilePath){require_once('PHPExcel/Classes/PHPExcel.php');$inputFileType='Excel2007';$objReader=PHPExcel_IOFactory::createReader($inputFileType);$objReader->setReadDataOnly(true);$objPHPExcel=$objR

耗尽 PHPExcel inputFileType objReader php

performance - 对齐 AVX-256 内存存储是否值得费心？

根据英特尔®64和IA-32架构优化引用手册，第B.4节(“英特尔®微架构代码名称SandyBridge的性能调整技术”)，第B.4.5小节。2(“助攻”):32-byteAVXstoreinstructionsthatspantwopagesrequireanassistthatcostsroughly150cycles.我正在使用YMM寄存器来复制小的固定大小的内存块，从32字节到128字节，并且这些block在堆管理器中按16字节对齐。该堆管理器之前使用过XMM寄存器和movdqa，我想将它“升级”到YMM，而不会将对齐方式从16字节更改为32字节。所以我使用vmovdquymm

费心 performance rcx mov rax assembly x86-64 memory-alignment avx

java - JNI 错误 : Local reference table overflow 512 entries

我的函数如下所示。它被执行了很多次。在某些时候它在jobjectnvarObject=env->GetObjectField(var1,nvar1)崩溃，给出错误JNI错误:本地引用表溢出512个条目。任何人都可以研究这个问题并提出一些启示。最佳答案所有返回jobject或类似对象引用的JNI方法都在引用表中创建本地引用。当您将控制权交还给JVM时，这些引用会自动清理，但如果您要创建许多引用(例如，在循环中)，则需要手动清理它们。您在cls引用上调用DeleteLocalRef是正确的，但请注意GetObjectField也返回

reference overflow code section jobject java android c++java-native-interface

c++ - 如何使用 SSE/AVX 高效地执行 double/int64 转换？

SSE2有在单精度float和32位整数之间转换vector的指令。_mm_cvtps_epi32()_mm_cvtepi32_ps()但是没有double和64位整数的等价物。换句话说，它们不见了:_mm_cvtpd_epi64()_mm_cvtepi64_pd()AVX好像也没有。模拟这些内在函数的最有效方法是什么？最佳答案在AVX512之前没有单一指令，它添加了与64位整数(有符号或无符号)的转换。(还支持与32位无符号的转换)。查看像_mm512_cvtpd_epi64这样的内在函数和更窄的AVX512VL版本，如_mm

amp double code strong 128 c++floating-point sse simd avx

python - 有没有为 AVX 指令编译的 TensorFlow 版本？

我正在尝试在我的Chromebook上安装TensorFlow，我知道这不是最好的地方，但我只是想感受一下。我在Python开发环境或任何开发环境中没有做太多工作，所以请耐心等待。搞清楚pip后，我安装TensorFlow并尝试导入它，收到这个错误:Python3.5.2(default,Nov232017,16:37:01)[GCC5.4.020160609]onlinuxType"help","copyright","credits"or"license"formoreinformation.>>>importtensorflowastf2018-12-1106:09:54.960

有为 TensorFlow 34 code pre python avx