可怕！CPU暗藏了这些未公开的指令！

轩辕之风O 2023-03-28 原文

大家好，我是轩辕。

我们知道，我们平时编程写的高级语言，是经过编译器编译以后，变成了CPU可以执行的机器指令：

而CPU能支持的指令，都在它的指令集里面了。

很久以来，我都在思考一个问题：

CPU有没有未公开的指令?

或者说：

CPU有没有隐藏的指令?

为什么会有这个问题?

平常我们谈论网络安全问题的时候，大多数时候都是在软件层面。谈应用程序的漏洞、后端服务的漏洞、第三方开源组件的漏洞乃至操作系统的漏洞。

但很少有机会去触及硬件，前几年爆发的熔断和幽灵系列漏洞，就告诉我们，CPU也不是可信任的。

要是CPU隐藏有某些不为人知的指令，这是一件非常可怕的事情。

如果某一天，某些国家或者某些团体组织出于某种需要，利用这些隐藏的指令来发动攻击，后果不堪设想。

虽然想到过这个问题，但我一直没有付诸实践去认真的研究。

直到前段时间，极客时间的一位老师分享了一份PDF给我，解答了我的疑惑。

这份PDF内容是2017年顶级黑客大会Black Hat上的一篇报告：《us-17-Domas-Breaking-The-x86-ISA》，作者是大神：@xoreaxeaxeax，熟悉汇编的同学知道这名字是什么意思吗?

这份PDF深度研究了x86架构CPU中隐藏的指令，原报告因为是英文，看起来有些晦涩，这篇文章，我尝试用大家易懂的语言来给大家分享一下这篇非常有意思的干货。

有些人会问：真的会有隐藏指令的存在吗，CPU的指令集不是都写在指令手册里了吗?

我们以单字节指令为例，单字节的范围是0x00-0XFF，总共256种组合，Intel的指令手册中是这样介绍单字节指令的：

横向为单字节的高四位，纵向为单字节的低四位，顺着表格定位，可以找到每一个单字节指令的定义。比如我们常见的nop指令的机器码是0x90，就是行为9，列为0的那一格。

但是不知道你发现没有，这张表格中还有些单元格是空的，比如0xF1，那CPU拿到一个为0xF1的指令，会怎么执行呢?

指令手册没告诉你。

这篇报告的主要内容就是告诉你，如何去寻找这些隐藏的指令。

指令集的搜索空间

想要找到隐藏的指令，得先明确一个问题：一条指令到底有多长，换句话说，有几个字节，我们应该在什么样的一个范围内去寻找隐藏指令。

如果指令长度是固定的，比如JVM那样的虚拟机，那问题好办，直接遍历就行了。

但问题难就难在，x86架构CPU的指令集属于复杂指令集CISC，它的指令不是固定长度的。

有单字节指令，比如：

90  nop

CC  int 3

C3  ret

也有双字节指令，比如：

8B C8  mov ecx,eax

6A 20  push 20h

还有三四节、四字节、五字节···最长能有十几个字节，比如这条指令：

指令：lock add qword cs:[eax + 4 * eax + 07e06df23h], 0efcdab89h

机器码：2e 67 f0 48 818480 23df067e 89abcdef

一个字节、两个字节，甚至三个四个遍历都还能接受，4个字节最多也就42亿多种组合，对于计算机来说，也还能接受。

但越往后，容量是呈指数型增长，这种情况再去遍历，显然是不现实的。

指令搜索算法

这份报告中提出了一种深度优先的搜索算法：

该算法的指导思想在于：快速跳过指令中无关紧要的字节。

怎么理解这句话?

比如压栈的指令push，下面几条虽然字节序列不同，但变化的只是数据，其实都是压栈指令，对于这类指令，就没必要花费时间去遍历：

68 6F 72 6C 64 push 646C726Fh
68 6F 2C 20 77 push 77202C6Fh
68 68 65 6C 6C push 6C6C6568h

第一个字节68就是关键字节，后面的四个字节都是压入栈中的数据，就属于无关紧要的字节。

如果能识别出这类，快速跳过，将能够大面积减少需要遍历的搜索空间。

(PS:本文来自公众号：编程技术宇宙)

上面只是一个例子，如何能够系统化的过滤掉这类指令呢?报告中提出了一个方案：

观察指令中的有意义的字节，它们对指令的长度和异常表现会产生冲击。

又该怎么理解这句话?

还是上面那个例子，当尝试修改第一个字节68的时候，这一段二进制序列可能就完全变成了别的指令，甚至指令长度都会发生变化(比如把68改成90，那就变成了一个字节的nop指令)，那么就认为这第一个字节是一个有意义的字节，修改了它会对指令的长度产生重要影响。

反之，如果修改后面字节的数据，会发现这仍然是一条5个字节的压栈指令，长度没变化，也没有其他异常行为表现与之前不同，那么就认为后面几个字节是无关紧要的字节。

在这个指导思想下，我们来看一个例子：

从下面这一段数据开始出发：

我们从两个字节的指令开始遍历：

把最后那个字节的内容+1，尝试去执行它：

发现指令长度没有变化(具体怎么判断指令长度变没变，下一节会重点讨论)，那就继续+1，再次尝试执行它：

一直这样加下去，直到发现加到4的时候，指令长度发生了变化，长度超过了2(但具体是多少还不知道，后文会解释)：

那么在这个基础上，长度增加1位，以指令长度为3的指令来继续上面的探索过程：从最后一位开始+1做起。

随着分析的深入，梳理一下指令搜索的路径图：

当某一条的最后一个字节遍历至FF时，开始往回走(就像递归，不能一直往下，总有回去的时候)：

往回走一个字节，将其+1，继续再来：

按照这个思路，整个要搜索的指令空间压缩到可以接受遍历的程度：

如何判定指令长度

现在来解答前面遗留的一个问题。

上面这个算法能够工作的一个重要前提是：

我们得知道，给末尾字节+1后，有没有影响指令的长度。

要判断某个字节是不是关键字节，就得知道这个字节的内容变化，会不会影响到指令长度，所以如果无法判断长度有没有变化，那上面的算法就无从谈起了。

所以如何知道长度有没有变化呢?报告中用到了一个非常巧妙的方法。

假设我们要评估下面这一串数据，前面开头到底多少个字节是一条完整指令。

可能第一个字节0F就是一条指令。

也可能前面两个字节0F 6A是一条指令。

还可能前面五个字节0F 6A 60 6A 79 6D是一条指令。

到底是什么情况，我们不知道，让我们用程序来尝试推导出来。

准备两个连续的内存页面，前面一个拥有可执行的权限，后面一个不能执行。

记住：当CPU发现指令位于不可执行的页面中时，它会抛异常!

现在，在内存中这样放置上面的数据流：第一个字节放在第一个页面的末尾位置，后面在字节放在第二个不可执行的页面上。

然后JMP到这条指令的地址，尝试去执行它，CPU中的译码器开始译码：

译码器译码发现是0F，不是单字节指令，还需要继续分析后面的字节，继续取第二个字节：

但注意，第二个字节是位于不可执行的页面，CPU检查发现后会抛出页错误异常：

如果我们发现CPU抛了异常，并且异常的地址指向了第二个页面的地址，那么我们可以断定：这条指令的长度肯定不止一个字节。

既然不止一个字节，那就往前挪一下，放两个字节在可执行页面，从第三个字节开始放在不可执行页面，继续这个过程。

继续上面这个过程，放三个字节在可执行页面：

四个：

当放了四个字节在可执行页面之后，事情发生了变化：

指令可以执行了!虽然也抛了异常(因为天知道这是个什么指令，会抛什么异常)，但页错误的地址不再是第二个页面的地址了!

有了这个信号，我们就知道，前面4个字节是一条完整的指令：

挖掘隐藏指令

现在核心算法和判断指令长度的方法都介绍完了，可以正式来开挖，挖出那些隐藏的指令了!

以一台Intel Core i7的CPU为目标，来挖一挖：

挖掘成果，收获颇丰：

这些都是Intel指令集手册中未交待，但CPU却能执行的指令。

然后是AMD Athon的CPU：

挖掘成果：

那这些隐藏的指令是做什么的呢?

有些已经被逆向工程分析了。

还有的就是毫无记录，只有Intel/AMD自己人知道了，谁知道它们用这些指令是来干嘛的?

软件即便是开源都能爆出各种各样的问题，何况是黑盒一样的硬件。

CPU作为计算机中的基石，它要是出了问题，那可是大问题。

我不是阴谋论，害人之心不可有，但防人之心不可无。

看完这些，我对国产、安全、自主可控这几个字的理解又加深了一层。

各位朋友，你对这些隐藏指令怎么看?欢迎评论区分享你的观点。

最后，欢迎大家加入我的知识星球，新一轮的学习活动就快要开始了。

暗藏可怕 style padding px 商务办公 $CPU 网络安全

有关可怕！CPU暗藏了这些未公开的指令！的更多相关文章

ruby - 为什么这些方法没有解决？ - 2
这个问题在这里已经有了答案:WhydoRubysettersneed"self."qualificationwithintheclass?(3个答案)关闭29天前。给定这段代码:classSomethingattr_accessor:my_variabledefinitialize@my_variable=0enddeffoomy_variable=my_variable+3endends=Something.news.foo我收到这个错误:test.rb:9:in`foo':undefinedmethod`+'fornil:NilClass(NoMethodError)fromtes
python - 这些脚本语言中哪种更适合渗透测试？ - 2
关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题？更新问题，以便editingthispost可以用事实和引用来回答它.关闭9年前。Improvethisquestion首先，我想避免一场关于语言的口水战。可供选择的语言有Perl、Python和Ruby。我想提一下，我对所有这些都很满意，但问题是我不能只专注于一个。例如，如果我看到一个很棒的Perl模块，我必须尝试一下。如果我看到一个不错的Python应用程序，我必须知道它是如何制作的。如果我看到RubyDSL或一些Ruby巫术，我就会迷上Ruby一段时间。目前我是一名Java开发人员，但计划在不久的将来
ruby-on-rails - 负载测试期间 Unicorn CPU 使用率激增，优化方法 - 2
我对为我的RubyonRails3.1.3应用优化我的Unicorn设置的方法很感兴趣。我目前正在高CPU超大实例上生成14个工作进程，因为我的应用程序在负载测试期间似乎受CPU限制。在模拟负载测试中，每秒大约20个请求重放请求，我的实例上的所有8个内核都达到峰值，盒子负载飙升至7-8个。每个unicorn实例使用大约56-60%的CPU。我很好奇可以通过哪些方式对其进行优化？我希望能够每秒将更多请求汇集到这种大小的实例上。内存和所有其他I/O一样完全正常。在我的测试过程中，CPU越来越低。最佳答案如果您受CPU限制，您希望使用
【Linux】初识Linux --指令Ⅰ - 2
Halo，这里是Ppeua。平时主要更新C语言，C++，数据结构算法，Linux…感兴趣就关注我吧！你定不会失望。目录1.ls显示当前目录下的文件内内容2.pwd-显示用户当前所在的目录3.cd-改变工作目录。将当前工作目录改变到指定的目录下1.cd-回到上一次待的工作空间2.cd..返回上一层目录1.相对路径:cd../aurora2.绝对路径:cd/home/aurora/lesson1/aurora3.cd~进入用户家目录4.cd/进入root目录4.mkdir-新建目录5.rmdir/rm-删除1.rmdir删除空文件夹2.rm删除1.rm-f2.rm-i3.rm-r1.ls显示当前目
iOS快捷指令：执行Python脚本（利用iSH Shell） - 2
文章目录前言核心逻辑配置iSH安装Python创建Python脚本配置启动文件测试效果快捷指令前言iOS快捷指令所能做的操作极为有限。假如快捷指令能运行Python程序，那么可操作空间就瞬间变大了。iSH是一款免费的iOS软件，它模拟了一个类似Linux的命令行解释器。我们将在iSH中运行Python程序，然后在快捷指令中获取Python程序的输出。核心逻辑我们用一个“获取当前日期”的Python程序作为演示（其实快捷指令中本身存在“获取当前日期”的操作，因而此需求可以不用Python，这里仅仅为了演示方便），核心代码如下。>>>importtime>>>time.strftime('%Y-%
ruby - Ruby 进程如何限制其 CPU 使用率？ - 2
假设我希望Ruby进程使用的CPU不超过15%。是否可以？怎么办？最佳答案您可以尝试使用Process.setrlimit来自标准核心:Setstheresourcelimitoftheprocess.这看起来只是setrlimit的包装器来自C库，因此它可能仅在Unix-ish平台上可用。setrlimit不支持CPU百分比限制，但它支持以秒为单位限制CPU时间。如果您只是想让您的Ruby进程不占用整个CPU，那么您可以尝试使用Process.setpriority来调整它的优先级。这只是libc的setpriority的包装
ruby-on-rails - 如果字段不为零，则葡萄实体有条件地公开 - 2
在一个葡萄实体中，我只想在没有运气的情况下显示一个字段(不是零？)。我正在尝试这段代码，但根本没有按预期工作，但总是隐藏该字段。expose:winner,:using=>PlayerEntity,:unless=>{:winner=>nil}我认为代码本身解释了我真正需要的东西，但正如我所说，我没有得到预期的结果。有什么线索吗？最佳答案好的，检查grape-entity的代码我发现你需要将这个block作为RubyProc传递。此代码将按预期工作:expose:winner,:using=>PlayerEntity,:unle
ruby-on-rails - 将配置文件模型的某些属性设置为对其他用户公开(可见)或私有(private)(不可见)的最佳方法是什么？ - 2
我有一个Profile模型，它有很多属性，比如电子邮件、图像、年龄、地址等。最终用户可以将某些属性设为私有(private)，以便其他用户无法查看。我通过向表private_attr添加一列并将其序列化以存储哈希来解决这个问题:-{email:true,address:true,age:false}这里的属性作为具有值true的键被认为是私有(private)的，不会向除这些属性所属的用户以外的用户显示。我想知道这是解决这个问题的最好方法，还是有其他方法。提前致谢。最佳答案我认为您可以只序列化用户希望在数组中私有(private
ruby - Unicorn Rails - 在生产模式下启动时占用 100% CPU - 2
我们正在使用Unicorn_Rails+nginx。它在我的系统(4GBRam，Intel(R)Core(TM)2DuoCPUP8600@2.40GHz)的开发模式和生产模式下运行良好我能够在本地系统中启动10个worker，但在任何情况下都无法在生产中启动超过2个有时它可以工作，但需要等待15-20米启动unicorn_rails时一直占用99.6%的CPU英特尔(R)至强(R)CPUE5507@2.27GHz但它卡在亚马逊(m1.small实例)1.73GB内存我发现没有人在任何地方谈论使用unicorn_rails启动缓慢...... 最佳答案
ruby-on-rails - Rails、Minitest 和 Guard - 为什么 rb-fsevent 占用了超过 100% 的 CPU？ - 2
我在我的Rails应用程序中运行守卫，测试套件(最小的)最近停止正常工作。如果幸运的话，它会运行所有测试一次，也许两次。在那之后，即使是一个小的测试文件被更改也需要很长时间才能响应，以至于使用gem变得徒劳无功。在测试运行时跟随top，我可以看到有一个ruby进程持续占用了超过100%的CPU。即使所有测试都已运行并且我没有对文件进行任何更改。ruby进程是:/Users/Bodacious/.rvm/gems/ruby-2.0.0-p247@MyApp/gems/rb-fsevent-0.9.3/bin/fsevent_watch--latency0.1/Users/Bodaio