为什么返回std::pair或boost::tuple比通过引用返回效率低得多?在我测试过的实际代码中,通过非常量引用而不是通过内部内核中的std::pair设置数据可以将代码速度提高20%。作为实验,我研究了三个最简单的情况,涉及将两个(预定义的)整数与两个整数相加:使用内部内联函数通过引用修改整数使用两个内部的内联函数按值返回整数使用一个内部的内联函数返回一个std::pair,它被复制到结果中。使用g++-c$x-Wall-Wextra-O2-S编译会产生相同的汇编代码,用于按引用传递和按值返回整数:__Z7getPairiRiS_:LFB19:pushq%rbpLCFI0:le