linux内核中的likely与unlikely

BSP-路人甲 2023-03-28 原文

前言

　内核版本：linux 4.9.x。在linux内核中，经常可以看见if( likely(x))或if( unlikely(x))的语句，本文将基于likely和unlikely的定义和作用进行一些简单的描述。

1. __builtin_expect 说明

1.1 __builtin_expect函数的声明

函数__builtin_expect()是GCC v2.96版本引入的, 其声明如下:

long __builtin_expect(long exp, long c);

1.2 __builtin_expect函数引入的背景

　　由于大部分程序员在分支预测方面做得很糟糕，所以GCC 提供了这个内建函数来帮助程序员处理分支预测。它的作用是期望表达式exp的值等于c（如果exp == c条件成立的机会占绝大多数，那么性能将会得到提升，否则性能反而会下降），原因如下：
GCC在编译过程中，会将可能性更大的代码紧跟着前面的代码，从而减少指令跳转带来的性能上的下降, 达到优化程序的目的：
（1）__builtin_expect函数用来引导gcc进行条件分支预测。在一条指令执行时，由于流水线的作用，CPU可以同时完成下一条指令的取指，这样可以提高CPU的利用率。在执行条件分支指令时，CPU也会预取下一条执行，但是如果条件分支的结果为跳转到了其他指令，那CPU预取的下一条指令就没用了，这样就降低了流水线的效率。
（2）另外，跳转指令相对于顺序执行的指令会多消耗CPU时间，如果可以尽可能不执行跳转，也可以提高CPU性能。

　　通常，你也许会更喜欢使用 gcc 的一个参数 '-fprofile-arcs' 来收集程序运行的关于执行流程和分支走向的实际反馈信息,但是对于很多程序来说,数据是很难收集的。

　注意， __builtin_expect (lexp, c)的返回值仍是exp值本身，并不会改变exp的值。

1.3 RATIONALE(原理)

if else 句型编译后, 一个分支的汇编代码紧随前面的代码,而另一个分支的汇编代码需要使用JMP指令才能访问到。显然，通过JMP访问需要更多的时间, 在复杂的程序中,有很多的if else句型,又或者是一个有if else句型的库函数,每秒钟被调用几万次，通常程序员在分支预测方面做得很糟糕, 编译器又不能精准的预测每一个分支,这时JMP产生的时间浪费就会很大,函数__builtin_expert()就是用来解决这个问题的。

2. likely和unlikely的说明

2.1 likely和unlikely函数的定义

参考/include/linux/compiler.h */

# define likely(x)	__builtin_expect(!!(x), 1)
# define unlikely(x)	__builtin_expect(!!(x), 0)

上述源码中采用了内建函数__builtin_expect来进行定义，即 built in function。

2.2 likely和unlikely的高频使用方式

在内核中经常看到如下的定义：

if(likely(x)){
	......
}else{
	......
}

if(unlikely(x))
{
	......
}else{
	......
}

展开后就等价于

if(__builtin_expect(!!(x), 1)){//期望x为真，x是逻辑真（1）的可能性比较大
	......
}else{
	......
}

if(__builtin_expect(!!(x), 0))//期望x为假，x是逻辑假（0）的可能性比较大
{
	......
}else{
	......
}

首选先要明白的是：

if(likely(x))    //等价于   if(x)
if(unlikely(x))  //也等价于 if(x)

　　从表面上看。 likely和unlikely是一样的，但是实际上执行是不同的，加likely的意思是x的值为真的可能性更大一些，也就是执行if的机会大，而unlikely表示x的值为假的可能性大一些，也就是执行else机会大一些。
　　加上这种修饰，编译成二进制代码时likely使得if后面的执行语句紧跟着前面的程序，unlikely使得else后面的语句紧跟着前面的程序，这样就会被cache预读取，增加程序的执行速度。
　　
上述定义中为什么要使用 "!!" 符号呢？
　　计算机中bool逻辑只有0和1，非0即是1，当likely(x)中参数不是逻辑值时，就可以使用 "!!" 符号转化为逻辑值1或0 。
　　

3. 汇编层理解

3.1 likely的例子

3.1.1 likely例子的代码

#include <stdlib.h>
#include <stdio.h>
#define unlikely(x)  (__builtin_expect(!!(x), 0))
#define likely(x)    (__builtin_expect(!!(x), 1))

int likely_func(int x)
{
	if (likely(x))
	{
		x = 0x123;
	}
	else
	{
		x = 0x456;
	}
	
	return x;
}

int main(char *argv[], int argc)
{
	likely_func(1);
    return 0;
}

3.1.2 编译选项

gcc -fprofile-arcs -O2 -c test.c

-fprofile-arcs -ftest-coverage 选项的使用

3.1.3反汇编likely_func片段

0000000000000000 <likely_func>:
   0:   f3 0f 1e fa             endbr64
   4:   48 83 05 00 00 00 00    addq   $0x1,0x0(%rip)        # c <likely_func+0xc>
   b:   01
   c:   b8 23 01 00 00          mov    $0x123,%eax           // 优先执行语句为if分支
  11:   85 ff                   test   %edi,%edi             //测试传入参数是否为0    
  13:   74 0b                   je     20 <likely_func+0x20> //若参数为0，则跳转
  15:   c3                      retq
  16:   66 2e 0f 1f 84 00 00    nopw   %cs:0x0(%rax,%rax,1)
  1d:   00 00 00
  20:   48 83 05 00 00 00 00    addq   $0x1,0x0(%rip)        # 28 <likely_func+0x28>
  27:   01
  28:   b8 56 04 00 00          mov    $0x456,%eax
  2d:   c3                      retq

test %edi %edi测试了传入的参数x是否为0。若结果为0，ZF=1语句je执行跳转。但是这里是likely,也就是x参数大部分是1的情况。所以这里避免了大部分的跳转。
过程使用 ret(从过程返回)，q是64位的意思。

3.2 unlikely的例子

3.2.1 unlikely例子的代码

#include <stdlib.h>
#include <stdio.h>
#define unlikely(x)  (__builtin_expect(!!(x), 0))
#define likely(x)    (__builtin_expect(!!(x), 1))

int unlikely_func(int x)
{
	if (unlikely(x))
	{
		x = 0x123;
	}
	else
	{
		x = 0x456;
	}
	
	return x;
}

int main(char *argv[], int argc)
{
	unlikely_func(1);
    return 0;
}

3.2.2 unlikely的编译选项

gcc -fprofile-arcs -O2 -c test.c

-fprofile-arcs -ftest-coverage 选项的使用

要声明一点的是：likely(x)用于x为真的可能性更大的场景，unlikey(x)用于x为假的可能性更大的场景，这两个宏的最终目的就是尽量减少跳转，因为只要跳转，pipeline就会flush，就会降低效率。想让上面的优化生效的话，需要指定一定的优化等级，因为默认是-O0，没有任何优化（一定要指定等级，您可以自己反汇编看一下编译选项加不加 -Ox的区别）。

3.2.3 反汇编unlikely_func片段

0000000000000000 <unlikely_func>:
   0:   f3 0f 1e fa             endbr64
   4:   85 ff                   test   %edi,%edi            //测试传入参数是否为0 
   6:   75 18                   jne    20 <unlikely_func+0x20>   //若参数不为0，则跳转
   8:   48 83 05 00 00 00 00    addq   $0x1,0x0(%rip)        # 10 <unlikely_func+0x10>
   f:   01
  10:   b8 56 04 00 00          mov    $0x456,%eax         // 优先执行语句为else分支
  15:   c3                      retq 
  16:   66 2e 0f 1f 84 00 00    nopw   %cs:0x0(%rax,%rax,1)
  1d:   00 00 00
  20:   48 83 05 00 00 00 00    addq   $0x1,0x0(%rip)        # 28 <unlikely_func+0x28>
  27:   01
  28:   b8 23 01 00 00          mov    $0x123,%eax
  2d:   c3                      retq

test %edi %edi测试了传入的参数x是否为0。若结果为0，ZF=1，语句jne不执行跳转。
- 过程使用 ret(从过程返回)，q是64位的意思。

3.3 if(likely(x)) 与 if(x) 在性能上的差异（针对博友的提问补充）

3.3.1 if(likely(x)) 例子的代码

#include <stdlib.h>
#include <stdio.h>
#define unlikely(x)  (__builtin_expect(!!(x), 0))
#define likely(x)    (__builtin_expect(!!(x), 1))

int likely_func(int x)
{
	if (likely(x))
	{
		x = 0x123;
	}
	else
	{
		x = 0x456;
	}
	
	return x;
}

int main(char *argv[], int argc)
{
	likely_func(1);
    return 0;
}

3.3.2 if(x) 例子的代码

#include <stdlib.h>
#include <stdio.h>
#define unlikely(x)  (__builtin_expect(!!(x), 0))
#define likely(x)    (__builtin_expect(!!(x), 1))

int likely_func(int x)
{
	if (x)
	{
		x = 0x123;
	}
	else
	{
		x = 0x456;
	}
	
	return x;
}

int main(char *argv[], int argc)
{
	likely_func(1);
    return 0;
}

3.3.3 编译选项

gcc -fprofile-arcs -O2 -c test.c

3.3.4 区别分析

可以清晰的看到：虽然if(x)与if (likely(x))功能相同，但是对于x为真的情况下， if(x)要返回，要经过跳转操作才能调用retq返回指令 。比if (likely(x))多了一次跳转指令。

4. 汇编test和je组合解释

test 指令用于两个操作数的按位AND运算，并根据结果设置标志寄存器，结果本身不会写回到目的操作数。

1. AND 运算结果为0时， ZF(zero flag)置位；
2. test可以影响CF，OF，PF，SF，ZF标志位；
3. 两个操作数相等，同时为0时，AND 结果为0， 此时ZF置位。

je 指令【Jump if Equals】在ZF被置位时跳转。je 是 jz 【Jump if Zero】的别名。

test 和 je 常用组合范例：

TEST EAX,EAX 
JE target_address

这段代码的含义是：
如果EAX==0,就跳转到”target_address”。

有关linux内核中的likely与unlikely的更多相关文章

ruby - 如何从 ruby 中的字符串运行任意对象方法？ - 2
总的来说，我对ruby还比较陌生，我正在为我正在创建的对象编写一些rspec测试用例。许多测试用例都非常基础，我只是想确保正确填充和返回值。我想知道是否有办法使用循环结构来执行此操作。不必为我要测试的每个方法都设置一个assertEquals。例如:describeitem,"TestingtheItem"doit"willhaveanullvaluetostart"doitem=Item.new#HereIcoulddotheitem.name.shouldbe_nil#thenIcoulddoitem.category.shouldbe_nilendend但我想要一些方法来使用
ruby - 其他文件中的 Rake 任务 - 2
我试图在一个项目中使用rake，如果我把所有东西都放到Rakefile中，它会很大并且很难读取/找到东西，所以我试着将每个命名空间放在lib/rake中它自己的文件中，我添加了这个到我的rake文件的顶部:Dir['#{File.dirname(__FILE__)}/lib/rake/*.rake'].map{|f|requiref}它加载文件没问题，但没有任务。我现在只有一个.rake文件作为测试，名为“servers.rake”，它看起来像这样:namespace:serverdotask:testdoputs"test"endend所以当我运行rakeserver:testid时
ruby-on-rails - Ruby net/ldap 模块中的内存泄漏 - 2
作为我的Rails应用程序的一部分，我编写了一个小导入程序，它从我们的LDAP系统中吸取数据并将其塞入一个用户表中。不幸的是，与LDAP相关的代码在遍历我们的32K用户时泄漏了大量内存，我一直无法弄清楚如何解决这个问题。这个问题似乎在某种程度上与LDAP库有关，因为当我删除对LDAP内容的调用时，内存使用情况会很好地稳定下来。此外，不断增加的对象是Net::BER::BerIdentifiedString和Net::BER::BerIdentifiedArray，它们都是LDAP库的一部分。当我运行导入时，内存使用量最终达到超过1GB的峰值。如果问题存在，我需要找到一些方法来更正我的代
ruby-on-rails - Rails 3 中的多个路由文件 - 2
Rails2.3可以选择随时使用RouteSet#add_configuration_file添加更多路由。是否可以在Rails3项目中做同样的事情？最佳答案在config/application.rb中:config.paths.config.routes在Rails3.2(也可能是Rails3.1)中，使用:config.paths["config/routes"] 关于ruby-on-rails-Rails3中的多个路由文件，我们在StackOverflow上找到一个类似的问题
ruby-on-rails - Rails - 一个 View 中的多个模型 - 2
我需要从一个View访问多个模型。以前，我的links_controller仅用于提供以不同方式排序的链接资源。现在我想包括一个部分(我假设)显示按分数排序的顶级用户(@users=User.all.sort_by(&:score))我知道我可以将此代码插入每个链接操作并从View访问它，但这似乎不是“ruby方式”，我将需要在不久的将来访问更多模型。这可能会变得很脏，是否有针对这种情况的任何技术？注意事项:我认为我的应用程序正朝着单一格式和动态页面内容的方向发展，本质上是一个典型的网络应用程序。我知道before_filter但考虑到我希望应用程序进入的方向，这似乎很麻烦。最终从任何
ruby-on-rails - Rails 3.2.1 中 ActionMailer 中的未定义方法 'default_content_type=' - 2
我在我的项目中添加了一个系统来重置用户密码并通过电子邮件将密码发送给他，以防他忘记密码。昨天它运行良好(当我实现它时)。当我今天尝试启动服务器时，出现以下错误。=>BootingWEBrick=>Rails3.2.1applicationstartingindevelopmentonhttp://0.0.0.0:3000=>Callwith-dtodetach=>Ctrl-CtoshutdownserverExiting/Users/vinayshenoy/.rvm/gems/ruby-1.9.3-p0/gems/actionmailer-3.2.1/lib/action_mailer
ruby-on-rails - Rails 应用程序中的 Rails : How are you using application_controller. rb 是新手吗？ - 2
刚入门rails，开始慢慢理解。有人可以解释或给我一些关于在application_controller中编码的好处或时间和原因的想法吗？有哪些用例。您如何为Rails应用程序使用应用程序Controller？我不想在那里放太多代码，因为据我了解，每个请求都会调用此Controller。这是真的？最佳答案 ApplicationController实际上是您应用程序中的每个其他Controller都将从中继承的类(尽管这不是强制性的)。我同意不要用太多代码弄乱它并保持干净整洁的态度，尽管在某些情况下ApplicationContr
ruby-on-rails - form_for 中不在模型中的自定义字段 - 2
我想向我的Controller传递一个参数，它是一个简单的复选框，但我不知道如何在模型的form_for中引入它，这是我的观点:{:id=>'go_finance'}do|f|%>Transferirde:para:Entrada:"input",:placeholder=>"Quantofoiganho?"%>Saída:"output",:placeholder=>"Quantofoigasto?"%>Nota:我想做一个额外的复选框，但我该怎么做，模型中没有一个对象，而是一个要检查的对象，以便在Controller中创建一个ifelse，如果没有检查，请帮助我，非常感谢,谢谢
ruby - rspec 需要 .rspec 文件中的 spec_helper - 2
我注意到像bundler这样的项目在每个specfile中执行requirespec_helper我还注意到rspec使用选项--require，它允许您在引导rspec时要求一个文件。您还可以将其添加到.rspec文件中，因此只要您运行不带参数的rspec就会添加它。使用上述方法有什么缺点可以解释为什么像bundler这样的项目选择在每个规范文件中都需要spec_helper吗？最佳答案我不在Bundler上工作，所以我不能直接谈论他们的做法。并非所有项目都checkin.rspec文件。原因是这个文件，通常按照当前的惯例，只
ruby-on-rails - active_admin 目录中的常量警告重新声明 - 2
我正在使用active_admin，我在Rails3应用程序的应用程序中有一个目录管理，其中包含模型和页面的声明。时不时地我也有一个类，当那个类有一个常量时，就像这样:classFooBAR="bar"end然后，我在每个必须在我的Rails应用程序中重新加载一些代码的请求中收到此警告:/Users/pupeno/helloworld/app/admin/billing.rb:12:warning:alreadyinitializedconstantBAR知道发生了什么以及如何避免这些警告吗？最佳答案在纯Ruby中:classA