草庐IT

Assembly

全部标签

c++ - ICC 中的 -O3 搞乱了内在函数,与 -O1 或 -O2 或相应的手动组装一起使用

这是对thisquestion的跟进.下面的4x4矩阵乘法C=AB的代码在所有优化设置的ICC上都可以正常编译。它在-O1和-O2上正确执行,但在-O3上给出不正确的结果。问题似乎来自_mm256_storeu_pd操作,因为用下面的asm语句替换它(并且只有它)会在执行后给出正确的结果。有什么想法吗?inlinevoidRunIntrinsics_FMA_UnalignedCopy_MultiplyMatrixByMatrix(double*A,double*B,double*C){size_ti;/*theregistersyouuse*/__m256da0,a1,a2,a3,b0

c++ - GCC 内联汇编错误 : Cannot take the address of 'this' , 这是一个右值表达式

我仍在与GCC作斗争-编译以下内联汇编代码(使用-fasm-blocks,启用Intel风格汇编syntax)给我一个奇怪的错误Cannottaketheaddressof'this',whichisanrvalueexpression...MyClass::MyFunction(){_asm{//...movebx,this//error:Cannottaketheaddressof'this',whichisanrvalueexpression//...moveax,this//error:Cannottaketheaddressof'this',whichisanrvalueex

c++ - 计算 sse var 最大掩码的最佳方法

(我只对前三个组件感兴趣)例如:[123?]应该生成[00-1?]此外,只设置一个“位”很重要,这样:[122?]不应该产生[0-1-1?]而是[0-10?]或[00-1?](哪个无关紧要)后来的(坏的)解决方案是可能的,例如通过提取水平最大值并与原始的进行比较:__m128abcd;//input__m128ccac=_mm_shuffle_ps(abcd,abcd,0x8A);__m128abcd_ccac=_mm_max_ps(abcd,ccac);__m128babb=_mm_shuffle_ps(abcd,abcd,0x51);__m128abcd_ccac_babb=_mm

c++ - g++ 处理复制 std::complex

作为自学项目的一部分,我研究了g++如何处理std::complex-类型,并对这个简单的函数感到困惑:#includestd::complexc;voidget(std::complex&res){res=c;}为Linux64使用g++-6.3-O3(或-Os)编译我得到了这个结果:movsdc(%rip),%xmm0movsd%xmm0,(%rdi)movsdc+8(%rip),%xmm0movsd%xmm0,8(%rdi)ret所以它将实部和虚部分别移动为64位float。但是,我希望程序集使用两个movups而不是四个movsd,即将实部和虚部作为128位包同时移动:movu

c++ - C/C++ : how to separate addressing mode code from actual instruction code 中的 6502 仿真器

在业余时间,我开始为6502CPU编写一个非常简单的C++仿真器。我过去常常为这个CPU写下很多汇编代码,所以所有的操作码、寻址模式和其他东西都不是什么大问题。6502有56条不同的指令加上13种寻址模式,总共提供151种不同的操作码。对我来说,速度不是问题,所以我不想写一个巨大的switch-case语句并一次又一次地重复相同的代码(不同的操作码可以使用不同的寻址模式引用相同的指令)我想将实际的指令代码与寻址模式代码:我发现这个解决方案非常简洁,因为它只需要编写13个寻址模式函数和56个指令函数,无需重复。这里寻址模式的作用是://Addressingmodesuint16_tAdd

c++ - 内联汇编程序调用子程序

我对内联汇编程序有疑问。可以在同一个函数中从内联汇编程序调用另一个汇编程序子例程吗?例如:voidFindValidPID(unsignedint&Pid){__asm{subesp,20hmoveax,Pidaddeax,eaxcallsub123;anotherassmsubroutinemovPid,eaxaddesp,20h}}我应该在哪里以及如何编写子例程sub123?干杯,托马斯 最佳答案 如果您在汇编中编写整个子例程,您应该考虑使用文件级汇编器而不是内联。 关于c++-内联

c++ - 如何从汇编代码中找出函数原型(prototype)?

我有一些汇编代码,我想找出调用函数的原型(prototype),以便我可以从C++代码中调用所有函数。我真正想做的是将一个dll注入(inject)到正在运行的进程中,并从我的dll中调用正在运行的进程的函数。现在我已经成功注入(inject)了我的dll但不知道如何进行“调用”。我是新手,对汇编代码了解不多。我的dll是用visualc++2012编写的。这是运行过程的代码:CPUDisasmAddressHexdumpCommandComments6013BE24/$53PUSHEBX6013BE25|.8B1D10461860MOVEBX,DWORDPTRDS:[60184610

c++ - 检索 x64 masm 汇编过程的参数

我有一个带有签名的函数:extern"C"intfoo(inta,intb,intc,intd,inte);实际上是用汇编写的。使用ml(32位),使用标准调用约定,您几乎可以编写.codefooPROCa:DWORD,b:DWORD,c:DWORD,d:DWORD,e:DWORDmoveax,dmovebx,e并开始使用这些标签来访问您的论点对于ml64(64位),fastcall是唯一可用的约定。我可以毫无问题地访问存储在寄存器中的第一个参数,但访问堆栈中的参数时会出现问题(本例中为e):我试过了.codefooPROCa:DWORD,b:DWORD,c:DWORD,d:DWORD

c++ - 为什么 GCC 生成的代码会从堆栈中读取垃圾?

考虑以下代码(使用Eigen):#include#includetemplateinlinetypenamestd::enable_if::typesetRow(Eigen::Matrix&){}templateinlinetypenamestd::enable_if::typesetRow(Eigen::Matrix&m,Rvval,Rs...args){m(row,N)=val;setRow(m,args...);}templateclassMatrixConstructor{Eigen::Matrixm;public:MatrixConstructor(constEigen::M

c++ - C++中的函数地址文字在哪里?

更新:经过一些额外的阅读,我真正想要的是保证早期绑定(bind)(这应该转化为对非虚函数和非PIC代码的立即调用),这可以通过传递一个(成员)函数作为模板参数。我遇到的问题是gcc=4,5和vs2008可以很好地处理这些模板参数调用。首先,也许文字不是这个概念的正确术语,但它是我能想到的最接近的术语(不是作为一等公民的功能意义上的文字)。这个想法是,当您进行常规函数调用时,它会编译成如下内容:callq但是如果你使用函数指针进行函数调用,它会编译成这样:mov,%raxcallq*%rax一切都很好。但是,如果我正在编写一个模板库,需要使用指定的参数列表进行某种回调,并且库的用户应该知