草庐IT

ASSEMBLY

全部标签

c++ - 如何在此循环中获得始终如一的高吞吐量?

在优化内部循环的过程中,我遇到了奇怪的性能行为,我无法理解和纠正这些行为。代码的简化版本如下;粗略地说,有一个巨大的数组,分为16个词block,我简单地把每个词block中的前导零的数量加起来。(实际上我使用的是来自DanLuu的popcnt代码,但在这里我选择了一个具有类似性能特征的更简单的指令以“简洁”。DanLuu的代码基于对thisSOquestion的回答。虽然它有非常相似的奇怪结果,但似乎并没有在这里回答我的问题。)//-*-compile-command:"gcc-O3-march=native-Wall-Wextra-std=c99-oclz-timingclz-ti

c++ - 什么是 __asm volatile ("pause"::: "memory");做?

我正在查看具有以下代码结构的开源C++项目:while(true){//Dosomethingworkif(some_condition_becomes_true)break;__asmvolatile("pause":::"memory");}最后一条语句是做什么的?我知道__asm意味着它是一个汇编指令,我发现一些关于pause指令的帖子说线程有效地暗示核心释放资源并给其他线程更多资源(在超线程的上下文中)。但是:::和memory有什么作用呢? 最佳答案 它是_mm_pause()和一个编译内存屏障,包装在一个GNUCExte

c++ - GCC 发出用于 boost::shared_ptr 取消引用的额外代码

我有以下代码:#includestructFoo{inta;};staticintA;voidfunc_shared(constboost::shared_ptr&foo){A=foo->a;}voidfunc_raw(Foo*constfoo){A=foo->a;}我以为编译器会创建相同的代码,但对于shared_ptr版本,发出了一条额外的看似冗余的指令。Disassemblyofsection.text:00000000:0:55pushebp1:89e5movebp,esp3:8b4508moveax,DWORDPTR[ebp+8]6:5dpopebp7:8b00moveax,

c++ - 在 Windows DLL 中通过它的签名查找函数

已在DLL中找到一个函数地址。没有这个DLL的源代码,不是我的。这个DLL还真的不是经常改的,但是一改了,我反汇编找就成问题了。在网上看到一些关于给它签名的笔记,然后通过这个保存的签名找到它。能否就如何实现这一点提供一些想法或工作示例? 最佳答案 你可以通过代码签名扫描来实现,这是我过去做过的事情。该概念主要基于这样一个事实,即函数在更新之间通常不会发生太大变化,而只是简单地重新定位,因为它们被扩展或收缩的其他函数向前或向后推。我们以MessageBoxA为例,他的反汇编对我来说是这样的:765DEA11>8BFFMOVEDI,ED

c++ - 如何指示 VC++ 编译器不内联常量?

我的C++程序中有以下全局常量:constintK=123456;当我编译程序时,生成的可执行文件在所有使用该值的地方(数十次)都包含文字值123456。但是,如果我删除const限定符,值123456在整个可执行文件中只出现一次(在.data部分).这是我正在寻找的结果。我希望值123456只出现一次,以便只需使用十六进制编辑器编辑.exe文件即可更改它。但是,我不想删除const限定符,因为我希望编译器防止我不小心修改源代码中的常量。是否可以指示编译器以某种方式不内联所述常量的值?我需要这样做的原因是,可执行文件很容易被负责“破解”示例程序以改变其行为的学生修改。对于没有经验的人来

c++ - 如何像编译器一样获取每一个虚函数索引?

是否有一些插件或工具可以读取.h文件(或简单地修改Intellisense本身)并吐出每个函数及其虚函数表索引?有一个模式我还没有弄清楚与多态性有关,当你开始有5个或更多类相互派生时,它会变得困难5倍。但是无论如何,MSVC++编译器在编译从C++到Assembly的虚函数调用时总是吐出正确的虚函数表索引。必须有更好的方法来获取该索引,而无需加载、断点、读取偏移量和重写代码,对吧?谢谢! 最佳答案 使用隐藏的MicrosoftC/C++编译器选项“/d1reportAllClassLayout”。这将打印出所有类的内存布局和vtab

c++ - 设置位是否与同一个字上的并发其他位集发生冲突?

假设我有一个位图,多个线程(在多个CPU上运行)正在其上设置位。没有使用同步,也没有原子操作。此外,不会进行任何重置。据我了解,当两个线程试图在同一个字上设置两个位时,最终只会执行一个操作。原因是要设置一个位,应该读取和写回整个字,因此当两个读取同时完成时,写回时一个操作会覆盖另一个操作。对吗?如果以上为真,那么字节操作是否也总是如此?也就是说,如果一个字是2个字节,并且每个线程都尝试将不同的字节设置为1,那么它们在并发完成时是否也会相互覆盖,或者某些系统是否支持将结果写回到一个字的一部分?问的原因是想弄清楚我必须放弃多少空间才能在位/字节/字映射操作中省略同步。

c++从无文件系统执行代码

首先,很难想出一个标题,它有点模棱两可,但是哦,好吧。好吧,我有一个混合的c++和asm引导加载程序。我可以将它复制到我的mbr上并运行它。我遇到的唯一问题是mbr非常小。我假设它的目的是只调用驱动器上其他地方编写的外部代码。我的问题是,我不确定如何访问它。我的意思是我可以把数据放在那里,我只是不知道如何以编程方式访问该数据,因为本质上驱动器不会有“文件系统”,只有任意代码。我在网上搜索过,但真正的底层开发教程似乎很少。如果有的话,我什至准备好使用C++库。 最佳答案 好老BIOScalls,用于个人电脑。如果您的主板不是PC-您需

c++ - 分析崩溃 - 将反汇编指令翻译成 C++ 等价物

我正在尝试调试崩溃。(ACCESS_VIOLATION)下面是反汇编片段。我标记了发生异常的行。在下面显示的实际C++代码中,它对应什么指令?反汇编:420:for(Uint32i=0;i06A923D93938cmpdwordptr[eax],edi06A923DB7659jbeICategoryNode::iterate+66h(6A92436h)06A923DD53pushebx06A923DE55pushebp06A923DF8B2D0460B006movebp,dwordptr[__imp_::AssertionFailure::logAssert(6B06004h)]06A

c++ - C++ vtables中的双重间接

我编写了这个非常简单的C++程序,我想知道为什么编译器将vtable布局为跨越两个指针取消引用。这是C++程序:classFoo{public:virtualvoidbar(){}};intmain(intargc,char*arv[]){Foofoo;Foo*foo_p(&foo);foo_p->bar();}现在,我可以查看编译器生成的程序集:$g++-ggdb-Wall-O0-Stest.cpp以下是相关部分:.loc190leaq-16(%rbp),%rax#puttheaddressof'foo'in%raxmovq%rax,%rdi#useitasthefirstargum