CTF-PHP反序列化漏洞1-基础知识

Eason_LYC 2023-07-30 原文

作者：Eason_LYC
悲观者预言失败，十言九中。乐观者创造奇迹，一次即可。
一个人的价值，在于他所拥有的。可以不学无术，但不能一无所有！
技术领域：WEB安全、网络攻防
关注WEB安全、网络攻防。我的专栏文章知识点全面细致，逻辑清晰、结合实战，让你在学习路上事半功倍，少走弯路！
个人社区：极乐世界-技术至上
追求技术至上，这是我们理想中的极乐世界~（关注我即可加入社区）

本专栏CTF基础入门系列打破以往CTF速成或就题论题模式。采用系统讲解基础知识+入门题目练习+真题讲解方式。让刚接触CTF的读者真正掌握CTF中各类型知识点，为后续自学或快速刷题备赛，打下坚实的基础~

目前ctf比赛，一般选择php作为首选语言，如读者不了解php的基本语法，请登录相关网站自学下基本语法即可，一般5-7天即可掌握基础。

1. 什么是PHP序列化和反序列化

1.1 基础概念

PHP序列化是将一个PHP对象转换成一个字符串，以便在不同的应用程序之间传递和存储。
反序列化是将序列化的字符串转换回PHP对象。攻击者可以通过构造恶意的序列化字符串来触发代码执行，这就是PHP反序列化漏洞的本质。
PHP序列化函数官方文档：https://www.php.net/manual/en/function.serialize.php
PHP反序列化函数官方文档：https://www.php.net/manual/en/function.unserialize.php

1.2 基础知识

序列化是将 PHP 对象转换为可存储或传输的字符串的过程。序列化后的字符串可以保存到文件或通过网络传输到其他计算机，在需要时可以反序列化为原始对象。

序列化的基本原理是将 PHP 对象转换为一组字符串，其中包含对象的属性和变量。序列化后的字符串可以被反序列化为原始对象，从而重新创建对象。

PHP 序列化可以使用 PHP 内置的 serialize() 函数进行。例如，以下代码将一个 PHP 对象序列化为字符串：

$object = new MyClass();
$string = serialize($object);

在上面的代码中，$object 是一个 MyClass 类的实例，serialize() 函数将其序列化为一个字符串，存储在 $string 变量中。

反序列化可以使用 PHP 内置的 unserialize() 函数进行。例如，以下代码将一个序列化的字符串反序列化为 PHP 对象：

$string = 'O:7:"MyClass":2:{s:3:"foo";s:3:"bar";s:3:"baz";i:123;}';
$object = unserialize($string);

在上面的代码中，$string 是一个序列化的字符串，unserialize() 函数将其反序列化为一个 MyClass 类的实例，存储在 $object 变量中。

需要注意的是，PHP 序列化只能序列化 PHP 对象，不能序列化资源、闭包等其他类型的数据。另外，由于序列化后的字符串包含对象的私有属性和方法，因此在反序列化时需要确保对象的类定义已经加载到内存中。

简单来说，就是将一个php对象转化为字符串保存（序列化），方便传输到远端后，在远端再还原成对象的一个过程（反序列化）。

1.3 PHP反序列化漏洞的危害

PHP反序列化漏洞可以导致远程代码执行，攻击者可以通过构造恶意的序列化字符串，将任意代码注入到应用程序中，从而实现控制服务器的目的。

简单说就是构造恶意的字符串（序列化），这样远端还原对象时（反序列化），就把恶意的对象还原并执行了。

1.4 PHP反序列化漏洞的防御措施

防御PHP反序列化漏洞的方法有多种，其中最重要的是对用户输入进行过滤和验证。此外，还可以使用PHP内置的序列化函数进行序列化和反序列化，而不是使用第三方库。

2. 知识点讲解

首先我们先看一个完整的PHP序列化和反序列化的代码

CTF中往往会直接给出代码，需要分析代码编制恶意字符串

2.1 类的访问修饰符

上图中定义了一个类Tree,类中前三行分别出现了public、private、protected,分别是什么意思呢？下面我们就来详细介绍下~·

类内部：是指类定义的内部，即类名后大括号{ }内部。
类外部：是指类定义的外部内容，即类名后大括号{}之外的所有地方。
类成员的访问权限控制分为：内部访问(私有的private)。内部访问(受保护protected)和全部访问(公有public)。

2.1.1 public 公开的

公开的属性或函数，可在类内部、外部访问
public $name='BMW'
public function XXX{}

2.1.2 protected 受保护的

受保护的属性或函数，只能在类及其子类、父类间内部访问。若想在外部访问，需要设置引用方法。
protected $color='blue'

2.1.3 private 私有的

私有的属性或函数，只能在当前类的内部访问，若想在外部访问，需要设置引用方法。

比如上图中最后三个echo的调用，如下图可以看到，public可以正常调用，其余两个产生报错

2.2. 相关函数和重要知识点

2.2.1 基础定义

序列化的目的是方便对象的传输和存储。

序列化

指将一个实例化的对象从一个实例转换为一个简短的序列化字符串，这样便于保存对象，可以将序列化字节存储到数据库或者文本当中。

反序列化

是当需要的时候再通过反序列化将序列化字符串解析，获取保存的对象，直接调用，而不需要重新实例化一个类

在PHP应用中，序列化和反序列化一般用做缓存，比如session缓存，cookie等

2.2.2 相关函数及技巧知识点

`serialize(mixed $value)`

参数为需要序列化的对象、数组、字符串等。返回值类型为字符串，即序列化字符串。

`unserialize(string $str): mixed`

参数类型为字符串，也就是序列化字符串。返回值为反序列化得到的对象、数组、字符串等。

<?php
class Car{
	public $name='BMW';
	protected $color='blue';
	private $size='large';
	private $price;

	function __construct(){
		echo '序列化时调用构造方法<br>';
	}

	function __destruct(){
		echo '反序列化时调用析构函数<br>';
	}

	function show(){
		echo $this->name.'<br>';
		echo $this->color.'<br>';
		echo $this->size.'<br>';
		echo 'price:"'.$this->price.'"<br>';
	}
}

$myCar = new Car();
$o = serialize($myCar);
print_r($o);
print_r("\n");
print_r(urlencode($o));
print_r("\n");

$un_o = unserialize(urlencode($o));
print_r($un_o);

?>
  
  
// 序列化时调用构造方法
// O:3:"Car":4:{s:4:"name";s:3:"BMW";s:8:"*color";s:4:"blue";s:9:"Carsize";s:5:"large";s:10:"Carprice";N;}
// O%3A3%3A%22Car%22%3A4%3A%7Bs%3A4%3A%22name%22%3Bs%3A3%3A%22BMW%22%3Bs%3A8%3A%22%00%2A%00color%22%3Bs%3A4%3A%22blue%22%3Bs%3A9%3A%22%00Car%00size%22%3Bs%3A5%3A%22large%22%3Bs%3A10%3A%22%00Car%00price%22%3BN%3B%7D

  
// 反序列化时调用析构函数

这段代码定义了一个名为Car的类，包含公共属性$name、受保护属性$color、私有属性$size和未定义初始值的私有属性$price，以及构造函数__construct()和析构函数__destruct()和一个公共方法show()，用于输出属性的值。

在代码中，首先创建了一个Car类的实例$myCar，并将其序列化为字符串$o，然后打印输出$o和$o的URL编码形式。

$o=O:3:"Car":4:{s:4:"name";s:3:"BMW";s:8:"*color";s:4:"blue";s:9:"Carsize";s:5:"large";s:10:"Carprice";N;}
urlencode($o) = O%3A3%3A%22Car%22%3A4%3A%7Bs%3A4%3A%22name%22%3Bs%3A3%3A%22BMW%22%3Bs%3A8%3A%22%00%2A%00color%22%3Bs%3A4%3A%22blue%22%3Bs%3A9%3A%22%00Car%00size%22%3Bs%3A5%3A%22large%22%3Bs%3A10%3A%22%00Car%00price%22%3BN%3B%7D

接着，将URL编码后的字符串$o反序列化为一个新的对象$un_o，并打印输出$un_o。

在输出的过程中，构造函数__construct()被调用，输出序列化时调用构造方法，而析构函数__destruct()在反序列化时被调用，输出反序列化时调用析构函数。在调用show()方法时，只有公共属性$name和受保护属性$color被输出，而私有属性$size的值无法输出。

PHP序列化字符串的格式如下:
对象类型:长度:“类名”:类中变量的个数:{类型:长度:“值”;类型:长度:“值”;......}

这里的长度是指字符串长度 o表示对象，a表示数组，s表示字符，i表示数字

2.2.3 【技巧】urlencode 序列化结果

%00为空字符，占位1位。正常浏览器不会显示，但是在urlencode下会显示
private在序列化后会出现%00*%00（%00*%00color）
protected在序列化后出现 %00类名%00变量名（%00Car%00size）

为避免浏览器不显示空字段，导致反序列化不成功，使用序列化时采用url编码
$o = urlencode(serialize($myCar))

2.2.4 【技巧】序列化引用R类型绕过比对

序列化的时候可以通R类型值来保存变量的引⽤（指针）状态。

上述含义为：input值引用correct值的结果。保持key[correct] = key[input]

2.2.5 PHP反序列化特点

PHP在序列化保存类对象状态时，只保存其中的变量和类名等，并不会保存序列化时类的结构（不保存方法）。在反序列化时其实就是将序列化字符串中存储的变量，带入到当前上下文环境中寻找到的类，去重新实例化对象。

3. PHP常用魔术方法

3.1 魔法函数汇总

在面向对象编程中，PHP 提供了一系列的魔术方法，这些魔术方法为编程提供了很多便利，在 PHP 中的作用是非常重要的。PHP 中的魔术方法通常以__（两个下划线）开始，并且不需要显式的调用而是在某种特定条件下自动调用的。上文中介绍的构造函数 __construct() 在实例化对象时调用，析构函数__destruct()在销毁对象时自动调用。常用魔术方法如下：

__construct()  // 构造函数，在实例化对象时调用
__destruct()   // 析构函数，在销毁对象时调用
__call(string $function_name, array $arguments)  // 在对象中调用一个不可访问或不存在的方法时被调用
__callStatic() // 用静态方式中调用一个不可访问方法时调用
__get($name)   // 获取对象不存在的属性或无法访问的属性时调用.$name表示要获取的属性名
__set($name, $value) // 设置对象不存在的属性或无法访问的属性时调用.$name表示要设置的属性名,$value表示要设置的值
__isset()     // 当对不可访问属性调用isset()或empty()时调用
__unset()     // 当对不可访问属性调用unset()时被调用
__sleep()     // 执行serialize()时，先会调用这个函数
__wakeup()    // 执行unserialize()时，先会调用这个函数
__toString()  // 类被当成字符串时的回应方法  echo $obj;
__invoke()    // 以调用函数的方式调用一个对象时的回应方法  $person();
__set_state() // 调用var_export()导出类时，此静态方法会被调用
__clone()     // 当对象复制完成时调用
__autoload()  // 尝试加载未定义的类
__debugInfo() // 打印所需调试信息

反序列化时会默认调用的方法有：

__destruct()
__wakeup()

魔法函数介绍推荐文章：
PHP之十六个魔术方法详细介绍
 PHP魔法方法/函数详解

3.2 魔法函数使用示例

下面这段代码，初学时也许看不明白，但其实含金量非常高，后续做题中，这个表要反复查看的~

<?php
# 设置⼀个类A
class A{
 private $name = "AS1def";
 function __construct()
 {
 echo "__construct() call\n";
 }
 function __destruct()
 {
 echo "\n__destruct() call\n";
 }
 function __toString()
 {
 return "__toString() call\n";
 }
 function __sleep()
 {
 echo "__sleep() call\n";
 return array("name");
 }
 function __wakeup()
 {
 echo "__wakeup() call\n";
 }
 function __get($a)
 {
 echo "__get() call\n";
 return $this->name;
 }
 function __set($property, $value)
 { echo "\n__set() call\n";
 $this->$property = $value;
 }
 function __invoke()
 {
 echo "__invoke() call\n";
 }
}
//调⽤ __construct()
$a = new A();
//调⽤ __toSting()
echo $a;
//调⽤ __sleep()
$b = serialize($a);
echo $b;
//调⽤ __wakeup()
$c = unserialize($b);
echo $c;
//不存在这个abcd属性，调⽤ __get()
echo $a->abcd;
//name是私有变量，不允许修改，调⽤ __set()
$a->name = "pro";
echo $a->name;
//将对象作为函数，调⽤ __invoke()
$a();
//程序结束，调⽤ __destruct() (会调⽤两次__destruct，因为中间有⼀次反序列化)

输出结果如下：

__construct() call
__toString() call
__sleep() call
O:1:"A":1:{s:7:"Aname";s:6:"AS1def";}__wakeup() call
__toString() call
__get() call
AS1def
__set() call
__get() call
pro__invoke() call

__destruct() call

__destruct() call

以上就是PHP反序列化的基础知识，下一篇文章就在这些基础知识上，开始题目的练习~

有关CTF-PHP反序列化漏洞1-基础知识的更多相关文章

ruby - 是否有用于序列化和反序列化各种格式的对象层次结构的模式？ - 2
给定一个复杂的对象层次结构，幸运的是它不包含循环引用，我如何实现支持各种格式的序列化？我不是来讨论实际实现的。相反，我正在寻找可能会派上用场的设计模式提示。更准确地说:我正在使用Ruby，我想解析XML和JSON数据以构建复杂的对象层次结构。此外，应该可以将该层次结构序列化为JSON、XML和可能的HTML。我可以为此使用Builder模式吗？在任何提到的情况下，我都有某种结构化数据-无论是在内存中还是文本中-我想用它来构建其他东西。我认为将序列化逻辑与实际业务逻辑分开会很好，这样我以后就可以轻松支持多种XML格式。最佳答案我最
Tomcat AJP 文件包含漏洞（CVE-2020-1938） - 2
目录1．漏洞简介2、AJP13协议介绍Tomcat主要有两大功能：3．Tomcat远程文件包含漏洞分析4．漏洞复现 5、漏洞分析6．RCE实现的原理1．漏洞简介2020年2月20日，公开CNVD的漏洞公告中发现ApacheTomcat文件包含漏洞（CVE-2020-1938）。ApacheTomcat是Apache开源组织开发的用于处理HTTP服务的项目。ApacheTomcat服务器中被发现存在文件包含漏洞，攻击者可利用该漏洞读取或包含Tomcat上所有webapp目录下的任意文件。该漏洞是一个单独的文件包含漏洞，依赖于Tomcat的AJP（定向包协议）。AJP自身存在一定缺陷，导致存在可控
postman接口测试工具-基础使用教程 - 2
1.postman介绍Postman一款非常流行的API调试工具。其实，开发人员用的更多。因为测试人员做接口测试会有更多选择，例如Jmeter、soapUI等。不过，对于开发过程中去调试接口，Postman确实足够的简单方便，而且功能强大。2.下载安装官网地址:https://www.postman.com/下载完成后双击安装吧，安装过程极其简单，无需任何操作3.使用教程这里以百度为例,工具使用简单，填写URL地址即可发送请求，在下方查看响应结果和响应状态码常用方法都有支持请求方法:getpostputdeleteGet、Post、Put与Delete的作用get：请求方法一般是用于数据查询，
软件测试基础 - 2
Ⅰ软件测试基础一、软件测试基础理论1、软件测试的必要性所有的产品或者服务上线都需要测试2、测试的发展过程3、什么是软件测试找bug，发现缺陷4、测试的定义使用人工或自动的手段来运行或者测试某个系统的过程。目的在于检测它是否满足规定的需求。弄清预期结果和实际结果的差别。5、测试的目的以最小的人力、物力和时间找出软件中潜在的错误和缺陷6、测试的原则28原则：20%的主要功能要重点测（eg：支付宝的支付功能，其他功能都是次要的）80%的错误存在于20%的代码中7、测试标准8、测试的基本要求功能测试性能测试安全性测试兼容性测试易用性测试外观界面测试可靠性测试二、质量模型衡量一个优秀软件的维度①功能性功
ES基础入门 - 2
ES一、简介1、ElasticStackES技术栈：ElasticSearch：存数据+搜索；QL；Kibana：Web可视化平台，分析。LogStash：日志收集，Log4j:产生日志；log.info(xxx)。。。。使用场景：metrics：指标监控…2、基本概念Index（索引）动词：保存（插入）名词：类似MySQL数据库，给数据Type（类型）已废弃，以前类似MySQL的表现在用索引对数据分类Document（文档）真正要保存的一个JSON数据{name:"tcx"}二、入门实战{"name":"DESKTOP-1TSVGKG","cluster_name":"elasticsear
ruby-on-rails - carrierwave:在序列化动态属性上安装 uploader - 2
首先，我使用的是rails3.1.3和来自master的carrierwavegithub仓库的分支。我使用after_init钩子(Hook)来确定基于属性的字段页面模型实例并为这些字段定义属性访问器将值存储在序列化哈希中(希望它清楚我是什么谈论)。这是我正在做的事情的精简版:classPage省略mount_uploader命令让我可以访问我想要的属性。但是当我安装uploader时出现错误消息说“nil类的未定义新方法”我在源代码中读到有方法read_uploader和扩展模块中的write_uploader。我如何必须覆盖这些来制作mount_uploader命令使用我的“虚拟
ruby - 我怎样才能更好地了解/了解更多关于 Ruby 的知识？ - 2
按照目前的情况，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visitthehelpcenter指导。关闭9年前。我最近开始学习Ruby，这是我的第一门编程语言。我对语法感到满意，并且我已经完成了许多只教授相同基础知识的教程。我已经写了一些小程序(包括我自己的数组排序方法，在有人告诉我谷歌“冒泡排序”之前我认为它非常聪明)，但我觉得我需要尝试更大更难的东西来理解更多关于Ruby.关于如何执行此操作的任何想法？
【网络】-- 网络基础 - 2
（本文是网络的宏观的概念铺垫）目录计算机网络背景网络发展认识"协议"网络协议初识协议分层OSI七层模型TCP/IP五层(或四层)模型报头以太网碰撞路由器IP地址和MAC地址IP地址与MAC地址总结IP地址MAC地址计算机网络背景网络发展是最开始先有的计算机，计算机后来因为多项技术的水平升高，逐渐的计算机变的小型化、高效化。后来因为计算机其本身的计算能力比较的快速：独立模式：计算机之间相互独立。如：有三个人，每个人做的不同的事物，但是是需要协作的完成。而这三个人所做的事是需要进行协作的，然而刚开始因为每一台计算机之间都是互相独立的。所以前面的人处理完了就需要将数据
什么是0day漏洞？如何预防0day攻击？ - 2
什么是0day漏洞？0day漏洞，是指已经被发现，但是还未被公开，同时官方还没有相关补丁的漏洞；通俗的讲，就是除了黑客，没人知道他的存在，其往往具有很大的突发性、破坏性、致命性。0day漏洞之所以称为0day，正是因为其补丁永远晚于攻击。所以攻击者利用0day漏洞攻击的成功率极高，往往可以达到目的并全身而退，而防守方却一无所知，只有在漏洞公布之后，才后知后觉，却为时已晚。“后知后觉、反应迟钝”就是当前安全防护面对0day攻击的真实写照！为了方便大家理解，中科三方为大家梳理当前安全防护模式下，一个漏洞从发现到解决的三个时间节点：T0：此时漏洞即0day漏洞，是已经被发现，还未被公开，官方还没有相
ruby-on-rails - 这个 C 和 PHP 程序员如何学习 Ruby 和 Rails？ - 2
按照目前的情况，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visitthehelpcenter指导。关闭9年前。我来自C、php和bash背景，很容易学习，因为它们都有相同的C结构，我可以将其与我已经知道的联系起来。然后2年前我学了Python并且学得很好，Python对我来说比Ruby更容易学。然后从去年开始，我一直在尝试学习Ruby，然后是Rails，我承认，直到现在我还是学不会，讽刺的是那些打着简单易学的烙印，但是对于我这样一个老练的程序员来说，我只是无法将它