iOS开发逆向之循环选择指针（上）

iOS是大鑫呀 2023-03-28 原文

本文的主要目的是理解汇编中全局变量、常量的存储，以及如何将if、while等汇编代码还原成高级代码

全局变量

在这之前首先需要了解内存的分区，对这块不是特别清晰的，建议看看iOS-底层原理：内存五大区，下面进行一个简单的汇总说明

代码区：存放代码，可读、可执行
栈区：存放参数、局部变量、临时数据，可读写
堆区：开发人员动态申请，大小可变，可读写
全局变量：可读可写
常量：只读

案例分析

首先作为一个开发者，有一个学习的氛围跟一个交流圈子特别重要，这是一个我的iOS开发交流群：130595548，不管你是小白还是大牛都欢迎入驻，让我们一起进步，共同发展！（群内会免费提供一些群主收藏的免费学习书籍资料以及整理好的几百道面试题和答案文档！）

在main.m中定义一个函数和一个全局变量

int g = 12;int func(int a, int b){    printf("haha");    int c = a + g;    return c;
}int main(int argc, char * argv[]) {

    func(1, 2);
}

func函数断点运行，以下是main函数的汇编代码
查看func的汇编代码，分析如下
- 查看x0是否为“haha”，通过调试得以验证，x0存的是haha的地址
- 查看其地址：x 0x000000010098bf9f，属于字符串的常量区（即左边是右边字符串的ASCII码）

其中重点分析adrp x0,1和add x0,x0,#0xf9f两句

adrp指令（address page 按页寻址）：
- 将1的值左移12位，此时的1是二进制
- 加上pc寄存器的值（先需要将pc的低12位清零）

<!--（按页寻址）--><!--adrp-->0x10098a824 <+20>: adrp   x0, 1
- 1）1左移12位：0x1000
- 2）pc寄存器低12位清零：0x10098a000
- 3）加上pc寄存器的值：0x10098a000 + 0x1000 = 0x10098b000
===> 得到x0地址就是某一页数据的起始位置（即首地址）<!--add-->0x10098a828 <+24>: add    x0, x0, #0xf9f            ; =0xf9f 
- adrp得到的地址加上偏移：0x10098b000 + 0xf9f = 0x10098bf9f
===> 此时的x0就是某一页中某段代码的地址，即当前代码段的地址

通过这个计算结果可知与上面调试的x0地址是一致的

why？：一个页的大小是4096，而0xFFF为4095，加上1就是0x1000（即4096），所以是1左移12位即可得到一个页的首地址（注：macOS的pageSize是 4k（0x1000），而iPhone的pageSize是16k（0x4000），但是16仍是4的倍数，adrp兼容者mac和iPhone，所以此时定位的仍然是一页数据）

继续分析bl printf以下的汇编代码
- ldur w8, [x29, #-0x4] ：拿出栈中的数据，即1
- adrp + add + ldr :拿出0x10098ce98内存地址的数据，将x9的数据给w10。这样就拿到了全局变量g

反汇编分析

示例代码如下

int g = 12;int func(int a, int b){    printf("haha");    int c = a + g + b;    return c;
}int main(int argc, char * argv[]) {
    func(10, 20);
}

通过hopper来进行反汇编分析

首先将工程编译：CMD+B
进入App的包
将第5步中的可执行文件拖入hopper中进行分析
在hopper中搜索func
拷贝func的汇编代码，将其还原成高级语言代码（即反汇编）

<!--1、将汇编初步还原为高级语言代码-->int gl = 12;int func2(int a, int b){    /*
     //一个函数的开始
     0000000100006808         sub        sp, sp, #0x20
     000000010000680c         stp        x29, x30, [sp, #0x10]
     0000000100006810         add        x29, sp, #0x10
    */

    /*
     //调用bl printf
     0000000100006814         stur       w0, [x29, #-0x4]
     0000000100006818         str        w1, [sp, #0x8]
     //===>此时的获取的0x100007f9f地址的数据 是没有ASLR的值
     000000010000681c         adrp       x0, #0x100007000
     0000000100006820         add        x0, x0, #0xf9f                              ; "haha"
     0000000100006824         bl         imp___stubs__printf
     */
    printf("haha");     /*
      0000000100006828         ldur       w8, [x29, #-0x4]
      */
    int w8 = a;    /*
      //===>此时的获取0x100008e98的数据
      000000010000682c         adrp       x9, #0x100008000
      0000000100006830         add        x9, x9, #0xe98                              ; _g
     *///    int gl = 12;//(需要写外面)
    /*
      0000000100006834         ldr        w10, x9
     */
    int w10 = gl;    /*
      0000000100006838         add        w8, w8, w10
     */
    w8 += w10;    /*
      000000010000683c         ldr        w10, [sp, #0x8]
     */
    w10 = b;    /*
      0000000100006840         add        w8, w8, w10
     */
    w8 += w10;    /*
      0000000100006844         str        w8, [sp, #0x4]
      0000000100006848         ldr        w8, [sp, #0x4]
      000000010000684c         mov        x0, x8
      */
    return w8;    /*
     //一个函数的结束
     0000000100006850         ldp        x29, x30, [sp, #0x10]
     0000000100006854         add        sp, sp, #0x20
     0000000100006858         ret
     */}

<!--2、去掉汇编-->int gl = 12;int func2(int a, int b){    printf("haha");    int w8 = a;    int w10 = gl;

    w8 += w10;

    w10 = b;

    w8 += w10;    return w8;
}

<!--3、简化代码-->int gl = 12;int func2(int a, int b){    printf("haha");    return a + b + gl;
}

简化过程如下图所示（注：是从下向上还原，而不是从上向下（业务逻辑是从上至下执行）：

其中

//===>此时的获取的0x100007f9f地址的数据 是没有ASLR的值
 000000010000681c         adrp       x0, #0x100007000      
 0000000100006820         add        x0, x0, #0xf9f

hopper中按G，查找0x100007f9f对应的数据

同理，获取全局变量g也是同样的原理

//===>此时的获取0x100008e98的数据000000010000682c         adrp       x9, #0x1000080000000000100006830         add        x9, x9, #0xe98                              ; _g0000000100006834         ldr        w10, x9

首先作为一个开发者，有一个学习的氛围跟一个交流圈子特别重要，这是一个我的iOS开发交流群：130595548，不管你是小白还是大牛都欢迎入驻，让我们一起进步，共同发展！（群内会免费提供一些群主收藏的免费学习书籍资料以及整理好的几百道面试题和答案文档！）

总结

获取全局变量和常量时，会出现adrp和add两条指令获得一个地址的情况
ADRP（Address Page）
- 将PC寄存器的低12位清零
- 将1的值，左移12位，16进制就是0x1000
- 以上两个结果相加放入x0寄存器
- adrp x0，1
通过ADD指令获取这页内存中的偏移值

条件

有如下代码，查看其汇编

int g = 12;void func(int a, int b){    if (a > b) {
        g = a;
    }else{
        g = b;
    }
}int main(int argc, char * argv[]) { 
    func(1, 2);
}

通过hopper查看其汇编，代码如下

_func:
 ==>拉伸栈空间 0000000100006828         sub        sp, sp, #0x10                               ; CODE XREF=_main+32
 ==>w0、w1数据入栈 000000010000682c         str        w0, [sp, #0xc]
 0000000100006830         str        w1, [sp, #0x8]
 ==>从栈中读取数据到w8、w9 0000000100006834         ldr        w8, [sp, #0xc]
 0000000100006838         ldr        w9, [sp, #0x8]

 ==>比较w8、w9，即比较w0、w1（cmp是减法，但不影响目标寄存器w8、w9，只看减法结果，修改标记寄存器） 000000010000683c         cmp        w8, w9 //如果是小于等于，就跳到到 loc_100006858 执行，如果是大于，则直接往下执行
 0000000100006840         b.le       loc_100006858 0000000100006844         ldr        w8, [sp, #0xc]
 0000000100006848         adrp       x9, #0x100008000
 000000010000684c         add        x9, x9, #0xe90                              ; _g
 0000000100006850         str        w8, x9 //硬跳，规避小于等于的代码，跳到loc_100006868
 0000000100006854         b          loc_100006868

                      loc_100006858: 0000000100006858         ldr        w8, [sp, #0x8]                              ; CODE XREF=_func+24
 000000010000685c         adrp       x9, #0x100008000
 0000000100006860         add        x9, x9, #0xe90                              ; _g
 0000000100006864         str        w8, x9

                      loc_100006868: 0000000100006868         add        sp, sp, #0x10                               ; CODE XREF=_func+44
 000000010000686c         ret

这是典型的if-else，通过hopper查看其汇编代码如下

将上述汇编代码进行还原

<!--1、还原-->int cc = 12;void func2(int a, int b){//==>拉伸栈空间//0000000100006828         sub        sp, sp, #0x10//==>w0、w1数据入栈//000000010000682c         str        w0, [sp, #0xc]//0000000100006830         str        w1, [sp, #0x8]//==>从栈中读取数据到w8、w9//0000000100006834         ldr        w8, [sp, #0xc]//0000000100006838         ldr        w9, [sp, #0x8]
    int w8 = a;    int w9 = b;//==>比较w8、w9，即比较w0、w1（cmp是减法，但不影响目标寄存器w8、w9，只看减法结果，修改标记寄存器）//000000010000683c         cmp        w8, w9////如果是小于等于，就跳到到 loc_100006858 执行，如果是大于，则直接往下执行//0000000100006840         b.le       loc_100006858
    if (w8 > w9 ) {//大于
        //0000000100006844         ldr        w8, [sp, #0xc]
        //0000000100006848         adrp       x9, #0x100008000
        //000000010000684c         add        x9, x9, #0xe90                              ; _g
        //0000000100006850         str        w8, x9
        cc = w8;//此时的w8是a
        ////硬跳，规避小于等于的代码，跳到loc_100006868
        //0000000100006854         b          loc_100006868

    }else{//小于等于
        //                     loc_100006858:
        //0000000100006858         ldr        w8, [sp, #0x8]
        //000000010000685c         adrp       x9, #0x100008000
        //0000000100006860         add        x9, x9, #0xe90                              ; _g
        //0000000100006864         str        w8, x9
        cc = w8;//此时的w8是b
    }//                     loc_100006868://0000000100006868         add        sp, sp, #0x10//000000010000686c         ret}

<!--2、简化-->int cc = 12;void func2(int a, int b){    if (a > b ) {//大于
        cc = a; 
    }else{//小于等于
        cc = b;
    }
}

cmp（Compare）比较指令

CMP把一个寄存器的内容和另一个寄存器的内容或立即数进行比较，但不存储结果，只是正确的更改标志(CMP后面跟的是B.LE，即else的条件)
一般CMP做完判断后会进行跳转，后面通常会跟上B指令
- BL 标号：跳转到标号处执行
- B.LT 标号：比较结果是小于（less than ），执行标号，否则不跳转
- B.LE 标号：比较结果是小于等于（less than or equal to），执行标号，否则不跳转
- B.GT 标号：比较结果是大于（greater than），执行标号，否则不跳转
- B.GE 标号：比较结果是大于等于（greater than or equal to），执行标号，否则不跳转

- `B.EQ 标号`：比较结果是`等于`，执行标号，否则不跳转
- `B.NE 标号`：比较结果是不等于（not equal）,执行标号，否则不跳转

- `B.HI 标号`：比较结果是`无符号大于`，执行标号，否则不跳转
- `B.HS 标号`：比较结果是`无符号大于等于`，执行标号，否则不跳转

循环

循环常用的主要有for、while、do-while，下面来一一进行分析

do-while分析

分析以下do-while的代码

int main(int argc, char * argv[]) {    int sum = 0;    int i = 0;    do{
        sum += 1;
        i++;
    }while (i<100);
}

通过hopper查看其汇编
汇编结束如下所示

结论：do-while循环：判断条件在后面，满足条件往外跳

while循环分析

int main(int argc, char * argv[]) {    int sum = 0;    int i = 0;    while (i<100){
        sum += 1;
        i++;
    }
}

汇编如图所示

结论：while循环：判断条件在里面，不满足就往外跳

for循环分析

int main(int argc, char * argv[]) { 
    int sum = 0;    for (int i = 0; i < 100; i++) {
        sum += 1;
    }
}

此时和while的汇编是一样的

结论：for循环很像：判断条件在里面，不满足就往外跳

总结

首先作为一个开发者，有一个学习的氛围跟一个交流圈子特别重要，这是一个我的iOS开发交流群：130595548，不管你是小白还是大牛都欢迎入驻，让我们一起进步，共同发展！（群内会免费提供一些群主收藏的免费学习书籍资料以及整理好的几百道面试题和答案文档！）

全局变量和常量

获取全局变量和常量时，会出现adrp和add两条指令获得一个地址的情况
ADRP（Address Page）
- 将PC寄存器的低12位清零
- 将1的值，左移12位
- 以上两个结果相加放入x0寄存器
- adrp x0，1
通过ADD指令获取这页内存中的偏移值

条件判断

CMP把一个寄存器的内容和另一个寄存器的内容或立即数进行比较，但不存储结果，只是正确的更改标志(CMP后面跟的是B.LE，即else的条件)
一般CMP做完判断后会进行跳转，后面通常会跟上B指令
- BL 标号：跳转到标号处执行
- B.LT 标号：比较结果是小于（less than ），执行标号，否则不跳转
- B.LE 标号：比较结果是小于等于（less than or equal to），执行标号，否则不跳转
- B.GT 标号：比较结果是大于（greater than），执行标号，否则不跳转
- B.GE 标号：比较结果是大于等于（greater than or equal to），执行标号，否则不跳转
- B.EQ 标号：比较结果是等于，执行标号，否则不跳转
- B.NE 标号：比较结果是不等于（not equal）,执行标号，否则不跳转
- B.HI 标号：比较结果是无符号大于，执行标号，否则不跳转
- B.HS 标号：比较结果是无符号大于等于，执行标号，否则不跳转

循环

do-while循环：判断条件在后面，满足条件往外跳
for循环和while循环很像：判断条件在里面，不满足就往外跳

iOS 开发 color background-color font iOS开发 swift xcode flutter 底层原理iOS 移动开发

有关iOS开发逆向之循环选择指针（上）的更多相关文章

ruby - 树顶语法无限循环 - 2
我脑子里浮现出一些关于一种新编程语言的想法，所以我想我会尝试实现它。一位friend建议我尝试使用Treetop(Rubygem)来创建一个解析器。Treetop的文档很少，我以前从未做过这种事情。我的解析器表现得好像有一个无限循环，但没有堆栈跟踪；事实证明很难追踪到。有人可以指出入门级解析/AST指南的方向吗？我真的需要一些列出规则、常见用法等的东西来使用像Treetop这样的工具。我的语法分析器在GitHub上，以防有人希望帮助我改进它。class{initialize=lambda(name){receiver.name=name}greet=lambda{IO.puts("He
ruby-on-rails - 在 Ruby 中循环遍历多个数组 - 2
我有多个ActiveRecord子类Item的实例数组，我需要根据最早的事件循环打印。在这种情况下，我需要打印付款和维护日期，如下所示:ItemAmaintenancerequiredin5daysItemBpaymentrequiredin6daysItemApaymentrequiredin7daysItemBmaintenancerequiredin8days我目前有两个查询，用于查找maintenance和payment项目(非排他性查询)，并输出如下内容:paymentrequiredin...maintenancerequiredin...有什么方法可以改善上述(丑陋的)代
ruby - 使用 C 扩展开发 rubygem 时，如何使用 Rspec 在本地进行测试？ - 2
我正在编写一个包含C扩展的gem。通常当我写一个gem时，我会遵循TDD的过程，我会写一个失败的规范，然后处理代码直到它通过，等等......在“ext/mygem/mygem.c”中我的C扩展和在gemspec的“扩展”中配置的有效extconf.rb，如何运行我的规范并仍然加载我的C扩展？当我更改C代码时，我需要采取哪些步骤来重新编译代码？这可能是个愚蠢的问题，但是从我的gem的开发源代码树中输入“bundleinstall”不会构建任何native扩展。当我手动运行rubyext/mygem/extconf.rb时，我确实得到了一个Makefile(在整个项目的根目录中)，然后当
ruby - RuntimeError(自动加载常量 Apps 多线程时检测到循环依赖 - 2
我收到这个错误:RuntimeError(自动加载常量Apps时检测到循环依赖当我使用多线程时。下面是我的代码。为什么会这样？我尝试多线程的原因是因为我正在编写一个HTML抓取应用程序。对Nokogiri::HTML(open())的调用是一个同步阻塞调用，需要1秒才能返回，我有100,000多个页面要访问，所以我试图运行多个线程来解决这个问题。有更好的方法吗？classToolsController0)app.website=array.join(',')putsapp.websiteelseapp.website="NONE"endapp.saveapps=Apps.order("
Ruby Sinatra 配置用于生产和开发 - 2
我已经在Sinatra上创建了应用程序，它代表了一个简单的API。我想在生产和开发上进行部署。我想在部署时选择，是开发还是生产，一些方法的逻辑应该改变，这取决于部署类型。是否有任何想法，如何完成以及解决此问题的一些示例。例子:我有代码get'/api/test'doreturn"Itisdev"end但是在部署到生产环境之后我想在运行/api/test之后看到ItisPROD如何实现？最佳答案根据SinatraDocumentation:EnvironmentscanbesetthroughtheRACK_ENVenvironm
ruby - 如何验证 IO.copy_stream 是否成功 - 2
这里有一个很好的答案解释了如何在Ruby中下载文件而不将其加载到内存中:https://stackoverflow.com/a/29743394/4852737require'open-uri'download=open('http://example.com/image.png')IO.copy_stream(download,'~/image.png')我如何验证下载文件的IO.copy_stream调用是否真的成功——这意味着下载的文件与我打算下载的文件完全相同，而不是下载一半的损坏文件？documentation说IO.copy_stream返回它复制的字节数，但是当我还没有下
ruby - 是否可以覆盖 gemfile 进行本地开发？ - 2
我们的git存储库中目前有一个Gemfile。但是，有一个gem我只在我的环境中本地使用(我的团队不使用它)。为了使用它，我必须将它添加到我们的Gemfile中，但每次我checkout到我们的master/dev主分支时，由于与跟踪的gemfile冲突，我必须删除它。我想要的是类似Gemfile.local的东西，它将继承从Gemfile导入的gems，但也允许在那里导入新的gems以供使用只有我的机器。此文件将在.gitignore中被忽略。这可能吗？最佳答案设置BUNDLE_GEMFILE环境变量:BUNDLE_GEMFI
ruby - 在 Windows 机器上使用 Ruby 进行开发是否会适得其反？ - 2
这似乎非常适得其反，因为太多的gem会在window上破裂。我一直在处理很多mysql和ruby-mysqlgem问题(gem本身发生段错误，一个名为UnixSocket的类显然在Windows机器上不能正常工作，等等)。我只是在浪费时间吗？我应该转向不同的脚本语言吗？最佳答案我在Windows上使用Ruby的经验很少，但是当我开始使用Ruby时，我是在Windows上，我的总体印象是它不是Windows原生系统。因此，在主要使用Windows多年之后，开始使用Ruby促使我切换回原来的系统Unix，这次是Linux。Rub
Ruby 文件 IO 定界符？ - 2
我正在尝试解析一个文本文件，该文件每行包含可变数量的单词和数字，如下所示:foo4.500bar3.001.33foobar如何读取由空格而不是换行符分隔的文件？有什么方法可以设置File("file.txt").foreach方法以使用空格而不是换行符作为分隔符？最佳答案接受的答案将slurp文件，这可能是大文本文件的问题。更好的解决方案是IO.foreach.它是惯用的，将按字符流式传输文件:File.foreach(filename,""){|string|putsstring}包含“thisisanexample”结果的
ruby-on-rails - 在 Rails 开发环境中为 .ogv 文件设置 Mime 类型 - 2
我正在玩HTML5视频并且在ERB中有以下片段:mp4视频从在我的开发环境中运行的服务器很好地流式传输到chrome。然而firefox显示带有海报图像的视频播放器，但带有一个大X。问题似乎是mongrel不确定ogv扩展的mime类型，并且只返回text/plain，如curl所示:$curl-Ihttp://0.0.0.0:3000/pr6.ogvHTTP/1.1200OKConnection:closeDate:Mon,19Apr201012:33:50GMTLast-Modified:Sun,18Apr201012:46:07GMTContent-Type:text/plain

iOS开发逆向之循环选择指针（上）

全局变量

案例分析

反汇编分析

总结

条件

cmp（Compare）比较指令

循环

do-while分析

while循环分析

for循环分析

总结

有关iOS开发逆向之循环选择指针（上）的更多相关文章

随机推荐