【linux】：进程地址空间

朵猫猫. 2023-04-18 原文

文章目录

前言
一、进程地址空间
总结

前言

本篇文章接着上一篇文章继续讲解进程，主要讲述了进程在运行过程中是如何在内存中被读取的以及为什么要有虚拟地址的存在，CPU在运行过程中是拿到程序的虚拟地址还是真实的物理内存。

一、进程地址空间

下面我们先写一个程序用来引出问题：

先写一个.c程序和makefile文件

我们通过创建一个子进程的方式，让子进程中的全局变量val改变而父进程不会改变，这样的结果在我们的预期中应该是子进程修改了全局变量导致父进程中的这个全局变量的值也发生改变，那么我们运行起来看看结果：

我们发现全局变量val的地址是一样的，但是值却不一样了，子进程修改了全局变量，但是在父进程中为什么全局变量没有被改变呢？这是因为进程具有独立性，进程 = 内核数据结构+代码数据也就是说每个进程的内核数据结构和代码数据也是独立的。那么val经过写时拷贝应该有两个不一样的地址才对，为什么打印出来的地址是一样呢？我们假设这是物理地址，有没有可能读取同一个变量的地址竟然会读到不同的数值呢？这是不可能的，既然是物理地址那就是唯一的，所以这一定不是物理地址！这就引入了我们今天所学习的虚拟地址，也叫线性地址。

进程地址空间本质就是一个内核数据结构，struct mm_struct{},下面我们画图描述一下：

如上图，首先一个进程中存放的是虚拟地址，在虚拟地址中又分为内核空间和用户空间，在用户空间中从低地址到高地址分别有正文代码，初始化数据，未初始化数据，堆，共享区，栈，命令行参数环境变量，而这些区域是如何划分的呢？其实很简单，只需要一个结构体即可：

就比如正文代码和初始化数据的划分只需要修改结构体中的start和end即可，像栈区的扩大堆区的缩小原理都是修改相对应区域的区间即可。那么地址空间又如何存储数据的呢？CPU和内存是用总线连接的，比如32位系统就用32根线连接，而这些线只能用0和1表示代表二进制，一共有2的32次方种排列方法。

如上图所示，进程地址空间就是一个线性范围，每个数字都是一个地址，而地址空间本质就是线性的。那么我们既然用的是虚拟地址又如何将数据保存到真实的物理内存呢？

虚拟地址通过页表+MMU映射到物理地址，MMU就是内存管理单元。也就是说进程先通过虚拟地址再由页表和MMU将虚拟地址映射找到其物理地址，这样我们就能解释为什么相同的地址却有不同的值，如下图：

父进程中大部分数据被子进程继承后两个进程都是一样虚拟地址，既然虚拟地址一样那么通过页表肯定也映射到相同的物理内存中了，当子进程要修改val 的时候是不能直接修改的，因为进程具有独立性如果子进程修改成功就会影响父进程，所以在子进程要修改的时候发生了写时拷贝，如下图：

由于发生写时拷贝只改变页表中的V值不改变K值所以虚拟地址是一样的而val不一样。

那么如果没有虚拟地址空间，操作系统是如何工作的呢？

如果没有虚拟地址那么直接访问物理内存，这样的方式是不安全的，一旦我们写的代码有问题或者出现野指针的情况，不小心将其他进程的数据修改了，那么就会出现很大的问题，虚拟地址可以保证在出现野指针等情况时直接拒绝映射到物理内存，这样你就访问不到物理内存，也就不会随意访问到其他进程的数据。所以虚拟地址空间的第一个作用是：防止地址随意访问，保护物理内存与其他进程。就比如这样的代码：char* p = "hello world"这样的代码我们是不能以p[0] = 'H'这样的方式修改的，因为hello world是保存在常量区的，对应的页表中的权限为r也就是只读权限所以我们不可以去修改。

那么当我们向操作系统申请内存，操作系统立马把内存给我们还是等我们用的时候再给呢？由于操作系统不允许任何的资源浪费，所以一定是在需要的时候才给空间。当然在我们申请内存成功后和使用之前，会有一段小小的时间窗口，在这个时间内即使空间没有被使用，别人也用不了这块空间，这叫做空间的闲置状态。由于页表的存在所以我们并不关心我们的代码放在物理内存的哪个位置只要存放在物理内存就可以了，这样就有了虚拟地址的第二个优点：将进程管理和内存管理进行解耦合。也就是说我们不用再像没有虚拟地址的时候那样直接存放在物理内存导致进程管理和内存管理在一起相互管理，有了虚拟地址就可以分开管理进程和内存。

当我们的程序再被编译的时候，没有被加载到内存，那么我们的程序内部有没有地址呢？答案是有地址。因为在编译的时候就有了相应的代码段和数据段，所以源代码在被编译的时候，就是按照虚拟地址空间的方式进行对代码和数据早就已经编好了对应的编制。那么CPU中读到的数据中涵盖的这个地址是虚拟的地址还是物理的地址呢？答案是虚拟的，因为程序在编译的时候就包含了虚拟地址，虚拟地址加载到内存后就具备了物理地址，然后通过映射就可以找到物理地址，而当程序加载到CPU中的时候CPU是看不到物理地址的，因为物理地址是由页表映射而来的，所以CPU只能看到虚拟地址。这就引出了虚拟地址的第三个优点：可以让进程以统一的视角，看待自己的代码和数据。

总结

本篇文章的重点是如何理解虚拟内存，我们通过画图的方式展示了进程地址空间，并且提到了虚拟内存的三个优点:1.将进程管理和内存管理进行解耦合 2.防止地址随意访问，保护物理内存与其他进程 3.可以让进程以统一的视角，看待自己的代码和数据

linux 进程 xff0c xff xff0 后端开发语言 c语言汇编

有关【linux】：进程地址空间的更多相关文章

ruby - 在 jRuby 中使用 'fork' 生成进程的替代方案？ - 2
在MRIRuby中我可以这样做:deftransferinternal_server=self.init_serverpid=forkdointernal_server.runend#Maketheserverprocessrunindependently.Process.detach(pid)internal_client=self.init_client#Dootherstuffwithconnectingtointernal_server...internal_client.post('somedata')ensure#KillserverProcess.kill('KILL',
ruby - 通过 ruby 进程共享变量 - 2
我正在编写一个gem，我必须在其中fork两个启动两个webrick服务器的进程。我想通过基类的类方法启动这个服务器，因为应该只有这两个服务器在运行，而不是多个。在运行时，我想调用这两个服务器上的一些方法来更改变量。我的问题是，我无法通过基类的类方法访问fork的实例变量。此外，我不能在我的基类中使用线程，因为在幕后我正在使用另一个不是线程安全的库。所以我必须将每个服务器派生到它自己的进程。我用类变量试过了，比如@@server。但是当我试图通过基类访问这个变量时，它是nil。我读到在Ruby中不可能在分支之间共享类变量，对吗？那么，还有其他解决办法吗？我考虑过使用单例，但我不确定这是
ruby - 从 Ruby 中的主机名获取 IP 地址 - 2
我有一个存储主机名的Ruby数组server_names。如果我打印出来，它看起来像这样:["hostname.abc.com","hostname2.abc.com","hostname3.abc.com"]相当标准。我想要做的是获取这些服务器的IP(可能将它们存储在另一个变量中)。看起来IPSocket类可以做到这一点，但我不确定如何使用IPSocket类遍历它。如果它只是尝试像这样打印出IP:server_names.eachdo|name|IPSocket::getaddress(name)pnameend它提示我没有提供服务器名称。这是语法问题还是我没有正确使用类？输出:ge
ruby-on-rails - 从应用程序中自定义文件夹内的命名空间自动加载 - 2
我们目前正在为ROR3.2开发自定义cms引擎。在这个过程中，我们希望成为我们的rails应用程序中的一等公民的几个类类型起源，这意味着它们应该驻留在应用程序的app文件夹下，它是插件。目前我们有以下类型:数据源数据类型查看我在app文件夹下创建了多个目录来保存这些:应用/数据源应用/数据类型应用/View更多类型将随之而来，我有点担心应用程序文件夹被这么多目录污染。因此，我想将它们移动到一个子目录/模块中，该子目录/模块包含cms定义的所有类型。所有类都应位于MyCms命名空间内，目录布局应如下所示:应用程序/my_cms/data_source应用程序/my_cms/data_ty
ruby - 无法在 Ruby 中将 ffmpeg 作为子进程运行 - 2
我正在尝试使用以下代码通过将ffmpeg实用程序作为子进程运行并获取其输出并解析它来确定视频分辨率:IO.popen'ffmpeg-i'+path_to_filedo|ffmpegIO|#myparsegoeshereend...但是ffmpeg输出仍然连接到标准输出并且ffmepgIO.readlines是空的。ffmpeg实用程序是否需要一些特殊处理？或者还有其他方法可以获得ffmpeg输出吗？我在WinXP和FedoraLinux下测试了这段代码-结果是一样的。最佳答案要跟进mouviciel的评论，您需要使用类似pope
Ruby 守护进程导致 ActiveRecord 记录器 IOError - 2
我目前正在用Ruby编写一个项目，它使用ActiveRecordgem进行数据库交互，我正在尝试使用ActiveRecord::Base.logger记录所有数据库事件具有以下代码的属性ActiveRecord::Base.logger=Logger.new(File.open('logs/database.log','a'))这适用于迁移等(出于某种原因似乎需要启用日志记录，因为它在禁用时会出现NilClass错误)但是当我尝试运行包含调用ActiveRecord对象的线程守护程序的项目时脚本失败并出现以下错误/System/Library/Frameworks/Ruby.frame
ruby - 在 ruby 中生成一个进程，捕获 stdout，stderr，获取退出状态 - 2
我想从rubyrake脚本运行一个可执行文件，比如foo.exe我希望将foo.exe的STDOUT和STDERR输出直接写入我正在运行rake任务的控制台.当进程完成时，我想将退出代码捕获到一个变量中。我如何实现这一目标？我一直在玩backticks、process.spawn、system但我无法获得我想要的所有行为，只有部分更新:我在Windows上，在标准命令提示符下，而不是cygwin 最佳答案 system获取您想要的STDOUT行为。它还返回true作为零退出代码，这可能很有用。$?填充了有关最后一次system调
ruby-on-rails - 如何用不同的用户运行nginx主进程 - 2
A/ctohttp://wiki.nginx.org/CoreModule#usermaster进程曾经以root用户运行，是否可以以不同的用户运行nginxmaster进程？最佳答案只需以非root身份运行init脚本(即/etc/init.d/nginxstart)，就可以用不同的用户运行nginxmaster进程。如果这真的是你想要做的，你将需要确保日志和pid目录(通常是/var/log/nginx&/var/run/nginx.pid)对该用户是可写的，并且您所有的listen调用都是针对大于1024的端口(因为绑定(
Ruby 守护进程和 JRuby - 备选方案 - 2
我有一个应用程序正在从Ruby迁移到JRuby(由于需要通过Java提供更好的Web服务安全支持)。我使用的gem之一是daemons创建后台作业。问题在于它使用fork+exec来创建后台进程，但这对JRuby来说是禁忌。那么-是否有用于创建后台作业的替代gem/wrapper？我目前的想法是只从shell脚本调用rake并让rake任务永远运行......提前致谢，克里斯。更新我们目前正在使用几个与Java线程相关的包装器，即https://github.com/jmettraux/rufus-scheduler和https://github.com/philostler/acts
ruby-on-rails - 验证电子邮件地址是 Paypal 用户 - 2
我想验证一个电子邮件地址是否是PayPal用户。是否有API调用来执行此操作？是否有执行此操作的ruby库？谢谢最佳答案 GetVerifiedStatus来自PayPal'sAdaptiveAccounts平台会为您做这件事。PayPal没有任何codesamples或SDKs用于Ruby中的自适应帐户，但我确实找到了编写codeforGetVerifiedStatusinRuby的人.您需要更改该代码以检查他们拥有的帐户类型的唯一更改是更改if@xml['accountStatus']!=nilaccount_status

【linux】：进程地址空间

文章目录

前言

一、进程地址空间

总结

有关【linux】：进程地址空间的更多相关文章

随机推荐