
代码区:存放代码,可读、可执行栈区:存放参数、局部变量、临时数据,可读写堆区:开发人员动态申请,大小可变,可读写全局变量:可读可写常量:只读首先作为一个开发者,有一个学习的氛围跟一个交流圈子特别重要,这是一个我的iOS开发交流群:130595548,不管你是小白还是大牛都欢迎入驻 ,让我们一起进步,共同发展!(群内会免费提供一些群主收藏的免费学习书籍资料以及整理好的几百道面试题和答案文档!)在main.m中定义一个函数和一个全局变量
int g = 12;int func(int a, int b){ printf("haha"); int c = a + g; return c;
}int main(int argc, char * argv[]) {
func(1, 2);
}

x0存的是haha的地址
x 0x000000010098bf9f,属于字符串的常量区(即左边是右边字符串的ASCII码)
adrp x0,1和add x0,x0,#0xf9f两句adrp指令(address page 按页寻址):<!--(按页寻址)--><!--adrp-->0x10098a824 <+20>: adrp x0, 1
- 1)1左移12位:0x1000
- 2)pc寄存器低12位清零:0x10098a000
- 3)加上pc寄存器的值:0x10098a000 + 0x1000 = 0x10098b000
===> 得到x0地址就是某一页数据的起始位置(即首地址)<!--add-->0x10098a828 <+24>: add x0, x0, #0xf9f ; =0xf9f
- adrp得到的地址加上偏移:0x10098b000 + 0xf9f = 0x10098bf9f
===> 此时的x0就是某一页中某段代码的地址,即当前代码段的地址通过这个计算结果可知与上面调试的x0地址是一致的why?:一个页的大小是4096,而0xFFF为4095,加上1就是0x1000(即4096),所以是1左移12位即可得到一个页的首地址(注:macOS的pageSize是 4k(0x1000),而iPhone的pageSize是16k(0x4000),但是16仍是4的倍数,adrp兼容者mac和iPhone,所以此时定位的仍然是一页数据)bl printf以下的汇编代码
ldur w8, [x29, #-0x4] :拿出栈中的数据,即1
adrp + add + ldr :拿出0x10098ce98内存地址的数据,将x9的数据给w10。这样就拿到了全局变量g
int g = 12;int func(int a, int b){ printf("haha"); int c = a + g + b; return c;
}int main(int argc, char * argv[]) {
func(10, 20);
}通过hopper来进行反汇编分析CMD+B




<!--1、将汇编初步还原为高级语言代码-->int gl = 12;int func2(int a, int b){ /*
//一个函数的开始
0000000100006808 sub sp, sp, #0x20
000000010000680c stp x29, x30, [sp, #0x10]
0000000100006810 add x29, sp, #0x10
*/
/*
//调用bl printf
0000000100006814 stur w0, [x29, #-0x4]
0000000100006818 str w1, [sp, #0x8]
//===>此时的获取的0x100007f9f地址的数据 是没有ASLR的值
000000010000681c adrp x0, #0x100007000
0000000100006820 add x0, x0, #0xf9f ; "haha"
0000000100006824 bl imp___stubs__printf
*/
printf("haha"); /*
0000000100006828 ldur w8, [x29, #-0x4]
*/
int w8 = a; /*
//===>此时的获取0x100008e98的数据
000000010000682c adrp x9, #0x100008000
0000000100006830 add x9, x9, #0xe98 ; _g
*/// int gl = 12;//(需要写外面)
/*
0000000100006834 ldr w10, x9
*/
int w10 = gl; /*
0000000100006838 add w8, w8, w10
*/
w8 += w10; /*
000000010000683c ldr w10, [sp, #0x8]
*/
w10 = b; /*
0000000100006840 add w8, w8, w10
*/
w8 += w10; /*
0000000100006844 str w8, [sp, #0x4]
0000000100006848 ldr w8, [sp, #0x4]
000000010000684c mov x0, x8
*/
return w8; /*
//一个函数的结束
0000000100006850 ldp x29, x30, [sp, #0x10]
0000000100006854 add sp, sp, #0x20
0000000100006858 ret
*/}
<!--2、去掉汇编-->int gl = 12;int func2(int a, int b){ printf("haha"); int w8 = a; int w10 = gl;
w8 += w10;
w10 = b;
w8 += w10; return w8;
}
<!--3、简化代码-->int gl = 12;int func2(int a, int b){ printf("haha"); return a + b + gl;
}简化过程如下图所示(注:是从下向上还原,而不是从上向下(业务逻辑是从上至下执行):

//===>此时的获取的0x100007f9f地址的数据 是没有ASLR的值
000000010000681c adrp x0, #0x100007000
0000000100006820 add x0, x0, #0xf9fG,查找0x100007f9f对应的数据
全局变量g也是同样的原理//===>此时的获取0x100008e98的数据000000010000682c adrp x9, #0x1000080000000000100006830 add x9, x9, #0xe98 ; _g0000000100006834 ldr w10, x9
首先作为一个开发者,有一个学习的氛围跟一个交流圈子特别重要,这是一个我的iOS开发交流群:130595548,不管你是小白还是大牛都欢迎入驻 ,让我们一起进步,共同发展!(群内会免费提供一些群主收藏的免费学习书籍资料以及整理好的几百道面试题和答案文档!)
全局变量和常量时,会出现adrp和add两条指令获得一个地址的情况PC寄存器的低12位清零x0寄存器adrp x0,1ADD指令获取这页内存中的偏移值int g = 12;void func(int a, int b){ if (a > b) {
g = a;
}else{
g = b;
}
}int main(int argc, char * argv[]) {
func(1, 2);
}通过hopper查看其汇编,代码如下_func:
==>拉伸栈空间 0000000100006828 sub sp, sp, #0x10 ; CODE XREF=_main+32
==>w0、w1数据入栈 000000010000682c str w0, [sp, #0xc]
0000000100006830 str w1, [sp, #0x8]
==>从栈中读取数据到w8、w9 0000000100006834 ldr w8, [sp, #0xc]
0000000100006838 ldr w9, [sp, #0x8]
==>比较w8、w9,即比较w0、w1(cmp是减法,但不影响目标寄存器w8、w9,只看减法结果,修改标记寄存器) 000000010000683c cmp w8, w9 //如果是小于等于,就跳到到 loc_100006858 执行,如果是大于,则直接往下执行
0000000100006840 b.le loc_100006858 0000000100006844 ldr w8, [sp, #0xc]
0000000100006848 adrp x9, #0x100008000
000000010000684c add x9, x9, #0xe90 ; _g
0000000100006850 str w8, x9 //硬跳,规避小于等于的代码,跳到loc_100006868
0000000100006854 b loc_100006868
loc_100006858: 0000000100006858 ldr w8, [sp, #0x8] ; CODE XREF=_func+24
000000010000685c adrp x9, #0x100008000
0000000100006860 add x9, x9, #0xe90 ; _g
0000000100006864 str w8, x9
loc_100006868: 0000000100006868 add sp, sp, #0x10 ; CODE XREF=_func+44
000000010000686c ret这是典型的if-else,通过hopper查看其汇编代码如下
<!--1、还原-->int cc = 12;void func2(int a, int b){//==>拉伸栈空间//0000000100006828 sub sp, sp, #0x10//==>w0、w1数据入栈//000000010000682c str w0, [sp, #0xc]//0000000100006830 str w1, [sp, #0x8]//==>从栈中读取数据到w8、w9//0000000100006834 ldr w8, [sp, #0xc]//0000000100006838 ldr w9, [sp, #0x8]
int w8 = a; int w9 = b;//==>比较w8、w9,即比较w0、w1(cmp是减法,但不影响目标寄存器w8、w9,只看减法结果,修改标记寄存器)//000000010000683c cmp w8, w9////如果是小于等于,就跳到到 loc_100006858 执行,如果是大于,则直接往下执行//0000000100006840 b.le loc_100006858
if (w8 > w9 ) {//大于
//0000000100006844 ldr w8, [sp, #0xc]
//0000000100006848 adrp x9, #0x100008000
//000000010000684c add x9, x9, #0xe90 ; _g
//0000000100006850 str w8, x9
cc = w8;//此时的w8是a
////硬跳,规避小于等于的代码,跳到loc_100006868
//0000000100006854 b loc_100006868
}else{//小于等于
// loc_100006858:
//0000000100006858 ldr w8, [sp, #0x8]
//000000010000685c adrp x9, #0x100008000
//0000000100006860 add x9, x9, #0xe90 ; _g
//0000000100006864 str w8, x9
cc = w8;//此时的w8是b
}// loc_100006868://0000000100006868 add sp, sp, #0x10//000000010000686c ret}
<!--2、简化-->int cc = 12;void func2(int a, int b){ if (a > b ) {//大于
cc = a;
}else{//小于等于
cc = b;
}
}CMP把一个寄存器的内容和另一个寄存器的内容或立即数进行比较,但不存储结果,只是正确的更改标志(CMP后面跟的是B.LE,即else的条件)BL 标号:跳转到标号处执行B.LT 标号:比较结果是小于(less than ),执行标号,否则不跳转B.LE 标号:比较结果是小于等于(less than or equal to),执行标号,否则不跳转B.GT 标号:比较结果是大于(greater than),执行标号,否则不跳转B.GE 标号:比较结果是大于等于(greater than or equal to),执行标号,否则不跳转- `B.EQ 标号`:比较结果是`等于`,执行标号,否则不跳转
- `B.NE 标号`:比较结果是不等于(not equal),执行标号,否则不跳转
- `B.HI 标号`:比较结果是`无符号大于`,执行标号,否则不跳转
- `B.HS 标号`:比较结果是`无符号大于等于`,执行标号,否则不跳转for、while、do-while,下面来一一进行分析int main(int argc, char * argv[]) { int sum = 0; int i = 0; do{
sum += 1;
i++;
}while (i<100);
}

do-while循环:判断条件在后面,满足条件往外跳int main(int argc, char * argv[]) { int sum = 0; int i = 0; while (i<100){
sum += 1;
i++;
}
}汇编如图所示
while循环:判断条件在里面,不满足就往外跳int main(int argc, char * argv[]) {
int sum = 0; for (int i = 0; i < 100; i++) {
sum += 1;
}
}此时和while的汇编是一样的
for循环很像:判断条件在里面,不满足就往外跳首先作为一个开发者,有一个学习的氛围跟一个交流圈子特别重要,这是一个我的iOS开发交流群:130595548,不管你是小白还是大牛都欢迎入驻 ,让我们一起进步,共同发展!(群内会免费提供一些群主收藏的免费学习书籍资料以及整理好的几百道面试题和答案文档!)全局变量和常量
全局变量和常量时,会出现adrp和add两条指令获得一个地址的情况PC寄存器的低12位清零x0寄存器adrp x0,1ADD指令获取这页内存中的偏移值CMP把一个寄存器的内容和另一个寄存器的内容或立即数进行比较,但不存储结果,只是正确的更改标志(CMP后面跟的是B.LE,即else的条件)BL 标号:跳转到标号处执行B.LT 标号:比较结果是小于(less than ),执行标号,否则不跳转B.LE 标号:比较结果是小于等于(less than or equal to),执行标号,否则不跳转B.GT 标号:比较结果是大于(greater than),执行标号,否则不跳转B.GE 标号:比较结果是大于等于(greater than or equal to),执行标号,否则不跳转B.EQ 标号:比较结果是等于,执行标号,否则不跳转B.NE 标号:比较结果是不等于(not equal),执行标号,否则不跳转B.HI 标号:比较结果是无符号大于,执行标号,否则不跳转B.HS 标号:比较结果是无符号大于等于,执行标号,否则不跳转do-while循环:判断条件在后面,满足条件往外跳for循环和while循环很像:判断条件在里面,不满足就往外跳我脑子里浮现出一些关于一种新编程语言的想法,所以我想我会尝试实现它。一位friend建议我尝试使用Treetop(Rubygem)来创建一个解析器。Treetop的文档很少,我以前从未做过这种事情。我的解析器表现得好像有一个无限循环,但没有堆栈跟踪;事实证明很难追踪到。有人可以指出入门级解析/AST指南的方向吗?我真的需要一些列出规则、常见用法等的东西来使用像Treetop这样的工具。我的语法分析器在GitHub上,以防有人希望帮助我改进它。class{initialize=lambda(name){receiver.name=name}greet=lambda{IO.puts("He
我有多个ActiveRecord子类Item的实例数组,我需要根据最早的事件循环打印。在这种情况下,我需要打印付款和维护日期,如下所示:ItemAmaintenancerequiredin5daysItemBpaymentrequiredin6daysItemApaymentrequiredin7daysItemBmaintenancerequiredin8days我目前有两个查询,用于查找maintenance和payment项目(非排他性查询),并输出如下内容:paymentrequiredin...maintenancerequiredin...有什么方法可以改善上述(丑陋的)代
我正在编写一个包含C扩展的gem。通常当我写一个gem时,我会遵循TDD的过程,我会写一个失败的规范,然后处理代码直到它通过,等等......在“ext/mygem/mygem.c”中我的C扩展和在gemspec的“扩展”中配置的有效extconf.rb,如何运行我的规范并仍然加载我的C扩展?当我更改C代码时,我需要采取哪些步骤来重新编译代码?这可能是个愚蠢的问题,但是从我的gem的开发源代码树中输入“bundleinstall”不会构建任何native扩展。当我手动运行rubyext/mygem/extconf.rb时,我确实得到了一个Makefile(在整个项目的根目录中),然后当
我收到这个错误:RuntimeError(自动加载常量Apps时检测到循环依赖当我使用多线程时。下面是我的代码。为什么会这样?我尝试多线程的原因是因为我正在编写一个HTML抓取应用程序。对Nokogiri::HTML(open())的调用是一个同步阻塞调用,需要1秒才能返回,我有100,000多个页面要访问,所以我试图运行多个线程来解决这个问题。有更好的方法吗?classToolsController0)app.website=array.join(',')putsapp.websiteelseapp.website="NONE"endapp.saveapps=Apps.order("
我已经在Sinatra上创建了应用程序,它代表了一个简单的API。我想在生产和开发上进行部署。我想在部署时选择,是开发还是生产,一些方法的逻辑应该改变,这取决于部署类型。是否有任何想法,如何完成以及解决此问题的一些示例。例子:我有代码get'/api/test'doreturn"Itisdev"end但是在部署到生产环境之后我想在运行/api/test之后看到ItisPROD如何实现? 最佳答案 根据SinatraDocumentation:EnvironmentscanbesetthroughtheRACK_ENVenvironm
这里有一个很好的答案解释了如何在Ruby中下载文件而不将其加载到内存中:https://stackoverflow.com/a/29743394/4852737require'open-uri'download=open('http://example.com/image.png')IO.copy_stream(download,'~/image.png')我如何验证下载文件的IO.copy_stream调用是否真的成功——这意味着下载的文件与我打算下载的文件完全相同,而不是下载一半的损坏文件?documentation说IO.copy_stream返回它复制的字节数,但是当我还没有下
我们的git存储库中目前有一个Gemfile。但是,有一个gem我只在我的环境中本地使用(我的团队不使用它)。为了使用它,我必须将它添加到我们的Gemfile中,但每次我checkout到我们的master/dev主分支时,由于与跟踪的gemfile冲突,我必须删除它。我想要的是类似Gemfile.local的东西,它将继承从Gemfile导入的gems,但也允许在那里导入新的gems以供使用只有我的机器。此文件将在.gitignore中被忽略。这可能吗? 最佳答案 设置BUNDLE_GEMFILE环境变量:BUNDLE_GEMFI
这似乎非常适得其反,因为太多的gem会在window上破裂。我一直在处理很多mysql和ruby-mysqlgem问题(gem本身发生段错误,一个名为UnixSocket的类显然在Windows机器上不能正常工作,等等)。我只是在浪费时间吗?我应该转向不同的脚本语言吗? 最佳答案 我在Windows上使用Ruby的经验很少,但是当我开始使用Ruby时,我是在Windows上,我的总体印象是它不是Windows原生系统。因此,在主要使用Windows多年之后,开始使用Ruby促使我切换回原来的系统Unix,这次是Linux。Rub
我正在尝试解析一个文本文件,该文件每行包含可变数量的单词和数字,如下所示:foo4.500bar3.001.33foobar如何读取由空格而不是换行符分隔的文件?有什么方法可以设置File("file.txt").foreach方法以使用空格而不是换行符作为分隔符? 最佳答案 接受的答案将slurp文件,这可能是大文本文件的问题。更好的解决方案是IO.foreach.它是惯用的,将按字符流式传输文件:File.foreach(filename,""){|string|putsstring}包含“thisisanexample”结果的
我正在玩HTML5视频并且在ERB中有以下片段:mp4视频从在我的开发环境中运行的服务器很好地流式传输到chrome。然而firefox显示带有海报图像的视频播放器,但带有一个大X。问题似乎是mongrel不确定ogv扩展的mime类型,并且只返回text/plain,如curl所示:$curl-Ihttp://0.0.0.0:3000/pr6.ogvHTTP/1.1200OKConnection:closeDate:Mon,19Apr201012:33:50GMTLast-Modified:Sun,18Apr201012:46:07GMTContent-Type:text/plain