草庐IT

CSAPP 之 ShellLab 详解

之一Yo 2023-03-28 原文

前言

本篇博客将会详细介绍 CSAPP 之 ShellLab 的完成过程,实现一个简易(lou)的 shell。tsh 拥有以下功能:

  • 可以执行外部程序
  • 支持四个内建命令,名称和功能为:
    • quit:退出终端
    • jobs:列出所有后台作业
    • bg <job>:继续在后台运行一个处于停止状态的后台作业,<job> 可以是 PID 或者 %JID 形式
    • fg <job>:将一个处于运行或者停止状态的后台作业转移到前台继续运行
  • 按下 ctrl + c 终止前台作业
  • 按下 ctrl + z 停止前台作业

实验材料中已经写好了一些函数,只要求我们实现下列核心函数:

  • eval:解析并执行指令
  • builtin_cmd:识别并执行内建指令
  • do_bgfg:执行 fgbg 指令
  • waitfg:阻塞终端直至前台任务完成
  • sigchld_handler:捕获 SIGCHLD 信号
  • sigint_handler:捕获 SIGINT 信号
  • sigtstp_handler:捕获 SIGTSTP 信号

下面是具体实现过程。

实现过程

首先实现 eval 函数,由于 builtin_cmd 函数实现了内建指令的执行,所以 eval 里面主要负责创建子进程来执行外部程序,并将子进程登记到 jobs 数组中。为了避免父子进程间的竞争引发的同步问题,需要在创建子进程前屏蔽掉 SIGCHLD 信号,由于子进程会复制父进程中的所有变量,所以子进程在执行外部程序之前应该解除屏蔽。同时 setpgid(0, 0) 使得子进程的进程组编号和不同于父进程 tsh,不然按下 ctrl + c 会直接退出终端。

void eval(char* cmdline) {
    char* argv[MAXARGS];
    pid_t pid;

    sigset_t mask_all, mask_one, prev_mask;
    sigfillset(&mask_all);
    sigemptyset(&mask_one);
    sigaddset(&mask_one, SIGCHLD);

    int bg = parseline(cmdline, argv);

    // 忽略空行
    if (argv[0] == NULL)
        return;

    if (builtin_cmd(argv))
        return;

    sigprocmask(SIG_BLOCK, &mask_one, &prev_mask);
    if ((pid = Fork()) == 0) {
        sigprocmask(SIG_SETMASK, &prev_mask, NULL);
        setpgid(0, 0);
        Execve(argv[0], argv, environ);
    }

    sigprocmask(SIG_BLOCK, &mask_one, NULL);
    addjob(jobs, pid, bg ? BG : FG, cmdline);

    if (!bg) {
        waitfg(pid);
    } else {
        printf("[%d] (%d) %s", pid2jid(pid), pid, cmdline);
    }

    sigprocmask(SIG_SETMASK, &prev_mask, NULL);
}

上述程序对 folkexecve 做了封装,可以让 eval 看起来更加简洁,代码如下所示:

pid_t Fork() {
    pid_t pid = fork();
    if (pid < 0)
        unix_error("Fork error");

    return pid;
}

int Execve(const char* __path, char* const* __argv, char* const* __envp) {
    int result = execve(__path, __argv, __envp);
    if (result < 0) {
        printf("%s: Command not found\n", __argv[0]);
        exit(1);
    }

    return result;
}

如果遇到前台作业,终端应该调用 waitfg 函数并处于阻塞状态,这里使用 sigsuspend 函数而不使用 sleep 函数的原因是不好确定要 sleep 多长时间,间隔太短浪费处理器资源,间隔太长速度就太慢了:

void waitfg(pid_t pid) {
    sigset_t mask;
    sigemptyset(&mask);

    while (fgpid(jobs)) {
        sigsuspend(&mask);
    }
}

builtin_cmd 的具体代码如下所示,只要使用 strcmp 函数来比对指令就行了:

int builtin_cmd(char** argv) {
    int is_buildin = 1;

    if (!strcmp(argv[0], "quit")) {
        exit(0);
    } else if (!strcmp(argv[0], "fg") || !strcmp(argv[0], "bg")) {
        do_bgfg(argv);
    } else if (!strcmp(argv[0], "jobs")) {
        listjobs(jobs);
    } else {
        is_buildin = 0;
    }

    return is_buildin; /* not a builtin command */
}

builtin_cmd 中最重要的就是 do_bgfg 函数,负责作业的状态转换,如下图所示:

代码如下所示,首先根据输入的 ID 获取作业,如果 ID 非法就提示错误信息,否则发送 SIGCONT 信号给进程组中的每一个进程,为了做到这一点,需要将 kill 函数的 pid 参数取负值,不然就只发给指定的进程了,显然这不是我们想要的结果:

void do_bgfg(char** argv) {
    char* cmd = argv[0];
    char* id = argv[1];
    struct job_t* job;

    if (id == NULL) {
        printf("%s command requires PID or %%jobid argument\n", cmd);
        return;
    }

    // 根据 jid/pid 获取作业
    if (id[0] == '%') {
        if ((job = getjobjid(jobs, atoi(id + 1))) == NULL) {
            printf("%s: No such job\n", id);
            return;
        }
    } else if (atoi(id) > 0) {
        if ((job = getjobpid(jobs, atoi(id))) == NULL) {
            printf("(%d): No such process\n", atoi(id));
            return;
        }
    } else {
        printf("%s: argument must be a PID or %%jobid\n", cmd);
        return;
    }

    // 状态转移
    if (!strcmp(cmd, "fg")) {
        job->state = FG;
        kill(-job->pid, SIGCONT);
        waitfg(job->pid);
    } else if (!strcmp(cmd, "bg")) {
        job->state = BG;
        kill(-job->pid, SIGCONT);
        printf("[%d] (%d) %s", job->jid, job->pid, job->cmdline);
    }
}

最后就是进行信号的处理了,由于同一种信号无法排队,需要使用 whilewaitpid,同时使用 WNOHANG | WUNTRACED 来处理终止和停止的情况。停止作业后需要修改 job 的状态为 ST,不然 waitfg 中的循环会一直进行下去:

void sigchld_handler(int sig) {
    int old_errno = errno;
    pid_t pid;
    int status;
    sigset_t mask_all, prev_mask;
    sigfillset(&mask_all);

    while ((pid = waitpid(-1, &status, WNOHANG | WUNTRACED)) > 0) {
        // 终止作业
        if (WIFEXITED(status) || WIFSIGNALED(status)) {
            sigprocmask(SIG_BLOCK, &mask_all, &prev_mask);

            // ctrl-c 终止
            if (WIFSIGNALED(status)) {
                printf("Job [%d] (%d) terminated by signal 2\n", pid2jid(pid), pid);
            }

            deletejob(jobs, pid);
            sigprocmask(SIG_SETMASK, &prev_mask, NULL);
        }
        // 停止作业
        else if (WIFSTOPPED(status)) {
            sigprocmask(SIG_BLOCK, &mask_all, &prev_mask);

            struct job_t* job = getjobpid(jobs, pid);
            job->state = ST;
            printf("Job [%d] (%d) stopped by signal 20\n", job->jid, job->pid);

            sigprocmask(SIG_SETMASK, &prev_mask, NULL);
        }
    }

    errno = old_errno;
}


void sigint_handler(int sig) {
    int old_errno = errno;

    pid_t pid = fgpid(jobs);
    if (pid > 0)
        kill(-pid, SIGKILL);

    errno = old_errno;
}


void sigtstp_handler(int sig) {
    int old_errno = errno;

    pid_t pid = fgpid(jobs);
    if (pid > 0)
        kill(-pid, SIGTSTP);

    errno = old_errno;
}

最后来测试一下 tsh 好不好使,这里使用看起来最复杂的 trace15.txt:

总结

通过这次实验,可以加深对进程控制和信号处理的理解,同时对于并发现象有了更直观的认识,以上~~

有关CSAPP 之 ShellLab 详解的更多相关文章

  1. 物联网MQTT协议详解 - 2

    一、什么是MQTT协议MessageQueuingTelemetryTransport:消息队列遥测传输协议。是一种基于客户端-服务端的发布/订阅模式。与HTTP一样,基于TCP/IP协议之上的通讯协议,提供有序、无损、双向连接,由IBM(蓝色巨人)发布。原理:(1)MQTT协议身份和消息格式有三种身份:发布者(Publish)、代理(Broker)(服务器)、订阅者(Subscribe)。其中,消息的发布者和订阅者都是客户端,消息代理是服务器,消息发布者可以同时是订阅者。MQTT传输的消息分为:主题(Topic)和负载(payload)两部分Topic,可以理解为消息的类型,订阅者订阅(Su

  2. Tcl脚本入门笔记详解(一) - 2

    TCL脚本语言简介•TCL(ToolCommandLanguage)是一种解释执行的脚本语言(ScriptingLanguage),它提供了通用的编程能力:支持变量、过程和控制结构;同时TCL还拥有一个功能强大的固有的核心命令集。TCL经常被用于快速原型开发,脚本编程,GUI和测试等方面。•实际上包含了两个部分:一个语言和一个库。首先,Tcl是一种简单的脚本语言,主要使用于发布命令给一些互交程序如文本编辑器、调试器和shell。由于TCL的解释器是用C\C++语言的过程库实现的,因此在某种意义上我们又可以把TCL看作C库,这个库中有丰富的用于扩展TCL命令的C\C++过程和函数,所以,Tcl是

  3. 【详解】Docker安装Elasticsearch7.16.1集群 - 2

    开门见山|拉取镜像dockerpullelasticsearch:7.16.1|配置存放的目录#存放配置文件的文件夹mkdir-p/opt/docker/elasticsearch/node-1/config#存放数据的文件夹mkdir-p/opt/docker/elasticsearch/node-1/data#存放运行日志的文件夹mkdir-p/opt/docker/elasticsearch/node-1/log#存放IK分词插件的文件夹mkdir-p/opt/docker/elasticsearch/node-1/plugins若你使用了moba,直接右键新建即可如上图所示依次类推创建

  4. 【Elasticsearch基础】Elasticsearch索引、文档以及映射操作详解 - 2

    文章目录概念索引相关操作创建索引更新副本查看索引删除索引索引的打开与关闭收缩索引索引别名查询索引别名文档相关操作新建文档查询文档更新文档删除文档映射相关操作查询文档映射创建静态映射创建索引并添加映射概念es中有三个概念要清楚,分别为索引、映射和文档(不用死记硬背,大概有个印象就可以)索引可理解为MySQL数据库;映射可理解为MySQL的表结构;文档可理解为MySQL表中的每行数据静态映射和动态映射上面已经介绍了,映射可理解为MySQL的表结构,在MySQL中,向表中插入数据是需要先创建表结构的;但在es中不必这样,可以直接插入文档,es可以根据插入的文档(数据),动态的创建映射(表结构),这就

  5. 最强Http缓存策略之强缓存和协商缓存的详解与应用实例 - 2

    HTTP缓存是指浏览器或者代理服务器将已经请求过的资源保存到本地,以便下次请求时能够直接从缓存中获取资源,从而减少网络请求次数,提高网页的加载速度和用户体验。缓存分为强缓存和协商缓存两种模式。一.强缓存强缓存是指浏览器直接从本地缓存中获取资源,而不需要向web服务器发出网络请求。这是因为浏览器在第一次请求资源时,服务器会在响应头中添加相关缓存的响应头,以表明该资源的缓存策略。常见的强缓存响应头如下所述:Cache-ControlCache-Control响应头是用于控制强制缓存和协商缓存的缓存策略。该响应头中的指令如下:max-age:指定该资源在本地缓存的最长有效时间,以秒为单位。例如:Ca

  6. IDEA 2022 创建 Spring Boot 项目详解 - 2

    如何用IDEA2022创建并初始化一个SpringBoot项目?目录如何用IDEA2022创建并初始化一个SpringBoot项目?0. 环境说明1.  创建SpringBoot项目 2.编写初始化代码0. 环境说明IDEA2022.3.1JDK1.8SpringBoot1.  创建SpringBoot项目        打开IDEA,选择NewProject创建项目。        填写项目名称、项目构建方式、jdk版本,按需要修改项目文件路径等信息。        选择springboot版本以及需要的包,此处只选择了springweb。        此处需特别注意,若你使用的是jdk1

  7. 详解Unity中的粒子系统Particle System (二) - 2

    前言上一篇我们简要讲述了粒子系统是什么,如何添加,以及基本模块的介绍,以及对于曲线和颜色编辑器的讲解。从本篇开始,我们将按照模块结构讲解下去,本篇主要讲粒子系统的主模块,该模块主要是控制粒子的初始状态和全局属性的,以下是关于该模块的介绍,请大家指正。目录前言本系列提要一、粒子系统主模块1.阅读前注意事项2.参考图3.参数讲解DurationLoopingPrewarmStartDelayStartLifetimeStartSpeed3DStartSizeStartSize3DStartRotationStartRotationFlipRotationStartColorGravityModif

  8. VMware虚拟机与本地主机进行磁盘共享(详解) - 2

    VMware虚拟机与本地主机进行磁盘共享前提虚拟机版本为Windows10(专业版,不是可能有问题)本地主机为家庭版或学生版(此版本会有问题,但有替代方式)最好是专业版VMware操作1.关闭防火墙,全部关闭。2.打开电脑属性3.点击共享-》高级共享-》权限4.如果没有everyone,就添加权限选择完全控制,然后应用确定。5.打开cmd输入lusrmgr.msc(只有专业版可以打开)如果不是专业版,可以跳过这一步。点击用户-》administrator密码要复杂密码,否则不行。推荐admaiN@1234类型的密码。设置完密码,点击属性,将禁用解开。6.如果虚拟机的windows不是专业版,可

  9. ElasticSearch之 ik分词器详解 - 2

    IK分词器本文分为简介、安装、使用三个角度进行讲解。简介倒排索引众所周知,ES是一个及其强大的搜索引擎,那么它为什么搜索效率极高呢,当然和他的存储方式脱离不了关系,ES采取的是倒排索引,就是反向索引;常见索引结构几乎都是通过key找value,例如Map;倒排索引的优势就是有效利用Value,将多个含有相同Value的值存储至同一位置。分词器为了配合倒排索引,分词器也就诞生了,只有合理的利用Value,才会让倒排索引更加高效,如果一整个Value不进行任何操作直接进行存储,那么Value和key毫无区别。分词器Analyzer通常会对Value进行操作:一、字符过滤,过滤掉html标签;二、分

  10. Educational Codeforces Round 146 (Rated for Div. 2)(B,E详解) - 2

    题外话:抑郁场,开局一小时只出A,死活想不来B,最后因为D题出锅ura才保住可怜的分。但咱本来就写不到DB-LongLegs(数论)本题题解法一学自同样抑郁的知乎作者幽血魅影的题解,有讲解原理。法二来着知乎巨佬cup-pyy(大佬说《不难发现》呜呜)题意三种操作:向上走mmm步向右走mmm步给自己一次走的步数加111,即使得m=m+1m=m+1m=m+1问从(0,0)(0,0)(0,0)走到(a,b)(a,b)(a,b)的最小操作次数,值得注意的是操作三不可逆。解析假设我们最终一步的大小增长到mmm,那么在这个过程中我能以[1,m][1,m][1,m](当步数增长到该数时)之间的任何数字向上或

随机推荐