草庐IT

bit_mask_avx

全部标签

c++ - AVX计算精度

我写了一个程序来显示mandelbrot集。为了加快速度,我通过使用了AVX(实际上是AVX2)指令。header。问题是:AVX计算(double)的结果有伪影,它与使用“正常”double计算的结果不同。详细来说,有一个函数getIterationCount它计算直到mandelbrot序列超过4的迭代次数,或者如果序列在前N个步骤中不超过4,则假定该点包含在集合中。代码如下所示:#include"stdafx.h"#include#include#includeclassMandelbrotSet{public:intgetIterationCount(conststd::com

c++ - 我是否负责在 QImage::bits() 函数提供的指针上调用 delete?

Qt类QImage有两个版本的bits()函数,返回指向底层图像数据的指针。一个是const,另一个不是。这是thedocumentation对于非常量版本:Returnsapointertothefirstpixeldata.ThisisequivalenttoscanLine(0).NotethatQImageusesimplicitdatasharing.Thisfunctionperformsadeepcopyofthesharedpixeldata,thusensuringthatthisQImageistheonlyoneusingthecurrentreturnvalue

c++ - AVX/SSE 回合向下 float 并返回整数 vector ?

有没有办法使用AVX/SSE获取浮点vector、向下舍入并生成整数vector?所有的floor内部方法似乎都产生了一个浮点的最终vector,这很奇怪,因为四舍五入产生了一个整数! 最佳答案 SSE可以从FP转换为整数,您可以选择截断(向零)或当前舍入模式(通常是IEEE默认模式,最接近平局舍入为偶数。像nearbyint(),与round()不同,其中tiebreak是远离0。如果您需要x86上的舍入模式,youhavetoemulateit,perhapswithtruncateasabuildingblock。)相关说明为

c++ - 如何创建一个随机的 bit64 值

我在尝试生成随机无符号__int64值时遇到问题,有人有快速有效的方法来做这样的事情吗?下面是我正在做的,检查下面的代码。unsigned__int64m_RandomKey=0;while(m_RandomKey==0){m_RandomKey=(unsigned__int64)rand()生成未签名的__int64key的最佳方法是什么,以便在一段时间后甚至根本无法再次获得相同的key?它不必是唯一的,只要18,446,744,073,709,551,615分之一的概率不再重复即可! 最佳答案 如果您使用的是C++11,则可以使

c++ - AVX 将 64 位整数转换为 64 位 float

我想使用AVX将4个打包的64位整数转换为4个打包的64位float。我试过类似的东西:int_64t*ls=(int64_t*)_mm_malloc(256,32);ls[0]=a;//...ls[3]=d;__mm256ipacked=_mm256_load_si256((__m256iconst*)ls);将在调试器中显示:(gdb)printpacked$4={1234,5678,9012,3456}到目前为止还好,但我能找到的唯一转换/转换操作是_mm256i_castsi256_pd,它无法满足我的要求:__m256dpd=_mm256_castsi256_pd(packe

c++ - 从 SSE 切换到 AVX 会受到惩罚吗?

我知道在没有先将所有ymm寄存器的上半部分清零的情况下从AVX指令切换到SSE指令的现有惩罚,但在我的机器(i7-3939K3.2GHz)上的特殊情况下,似乎即使我确实在AVX代码部分前后明确使用_mm256_zeroupper,也会对相反方向(SSE到AVX)造成很大的惩罚。我已经编写了在32位float和32位定点整数之间转换的函数,在2个32768个元素宽的缓冲区上。我将一个SSE2内部版本直接移植到AVX以在SSE的4个元素上同时处理8个元素,期望看到显着的性能提升,但不幸的是,相反的情况发生了。所以,我有两个功能:voidConvertPcm32FloatToPcm32Fix

c++ - OpenCV (C++) : how to save a 16bit image?

我正在使用kinect,我需要保存RAW深度图像。这意味着我不应该通过转换为8位来保存它(这就是imwrite正在做的!),而是将它保存为16位,而不减少任何位深度。我希望这个问题不会太琐碎,但我是OpenCV编程的新手。我尝试了以下方法,但它不起作用:[...]MatimageDepth(480,640,CV_16UC1);MatimageRGB;//VideostreamsettingsVideoCapturecapture;capture.open(CAP_OPENNI);if(!capture.isOpened()){cerr提前致谢。 最佳答案

c++ - SSE 内在函数 : masking a float and using bitwise and?

基本上这个问题与x86汇编器有关,您有一个数字,您希望使用and将其设置为零或数字本身。.如果你andnumber为负数你会得到number本身,但如果你and它与零你得到零。现在我在使用SSEinstrinsics时遇到的问题是float在二进制中与double不同(或者我弄错了)。无论如何,这是代码,我尝试使用各种float来掩盖第二个和第三个数字(分别为127.0f和99.0f),但没有成功。#include#includevoidprint_4_bit_num(constchar*label,__m128var){float*val=(float*)&var;printf("%

c++ - VS 编译警告 : result of 32-bit shift implicitly converted to 64 bits

VisualStudio2013发出恼人的(看似无关紧要的)编译警告:#include#definePRECISION16uint64_thi=0;for(uint8_ti=0;i这是编译警告:warningC4334:'改1好像解决了至1.所以我一直在尝试找出1中可能出现的问题.显然,如果i>=PRECISION,那么左移操作将产生未定义的行为。但是,变量i不超过PRECISION-1的值.此外,即使我们假设编译器无法推断出这个事实,我也看不出这个编译警告与左移操作数导致的潜在未定义行为有什么关系。也许它假定PRECISION-1-i的无符号值可以大于31。但是我应该如何告诉编译器它

c++ - 测试 AVX 寄存器是否包含一些相等的整数

考虑一个包含四个64位整数的256位寄存器。是否有可能在AVX/AVX2中有效地测试其中一些整数是否相等?例如:a){43,17,25,8}:结果必须是false因为4个数字中没有2个是相等的。b){47,17,23,17}:结果必须为“真”,因为编号17在AVXvector寄存器中出现2次。如果可能的话,我想在C++中执行此操作,但如有必要,我可以转到汇编。 最佳答案 对于AVX512(AVX512VL+AVX512CD),您将使用VPCONFLICTQ,专为此目的而设计。对于AVX2:通过减少冗余比较减少了一些操作:inttes