Linux学习第六天（进程）

🕗 发布于 2024-04-08 13:28 学习 linux

1、操作系统

概念：

任何计算机系统都包含一个基本的程序集合，称为操作系统，操作系统包含内核和其他程序。

设置操作系统的目的：

与硬件交互，管理所有的软硬件资源；为用户程序（应用程序）提供一个良好的执行环境

定位：

一款纯正的“搞管理”的软件

总结：

计算机管理硬件：先描述再组织，描述是用struct结构体，组织是用链表或其他高效的数据结构

系统调用和库函数：

在开发角度，操作系统对外会表现为一个整体，但是会暴露自己的部分接口，供上层开发使用，这部分由操作系统提供的接口，叫做系统调用。系统调用在使用上，对用户的要求比较高，所以开发者可以对部分系统调用进行适度封装，成为了库，便于用户进行开发

2、进程

概念：

程序的一个执行实例，正在执行的程序等，担当分配系统资源的实体

描述进程-PCB：

进程信息被放在一个叫做进程控制块的数据结构中，可以理解为进程的属性的集合，linux下的PCB是task_struct

task_struct-PCB的一种：

linux中描述进程的结构体叫做task_struct；task_struct是linux内核的一种数据结构，它会被装载到内存里并且会包含进程的信息

task_struct内容的分类：

标识符：描述本进程的唯一标识符，用来区别其他进程
状态：任务状态，退出代码，退出信号等
优先级：相对于其他进程的优先级
程序计数器：程序中即将被执行的下一条指令的位置
内存指针：包含程序代码和进程相关数据的指针，还有和其他进程共享的内存块的指针
上下文数据（重点）：进程执行时处理器的寄存器中的数据
I/O状态信息：包含显示的I/O请求，分配给进程的I/O设备和被进程使用的文件列表
记账信息：可能包括处理器和时间总和，使用的时钟数总和，时间限制，记账号

组织进程：

可以在内核源代码查找到它。所有运行在系统里的进程都以task_struct链表的形式存储在内核里

查看进程

进程的信息可以通过/proc系统文件夹里查看

比如要查看PID为1 的进程信息，可以查看/proc/1这个文件夹。大多数进程信息同样可以使用top和ps这些用户级工具来获取

通过系统调用获取进程提示符

进程id：（PID）
父进程id：（PPID）

#include<stdio.h>
#include<sys/types.h>
#include<unistd.h>

int main()
{
    printf("pid: %d\n",getpid());
    printf("ppid: %d\n",getppid());
    return 0;
}

通过系统调用创建进程-fork标识

可以使用man fork认识fork
fork有两个返回值
父子进程代码共享，数据各自开辟空间，私有一份（采用写时拷贝)

#include<stdio.h>
#include<sys/types.h>
#include<unistd.h>

int main()
{
    int ret = fork();
    if(ret < 0)
    {
        perror("fork");
        return 1;
    }
    else if(ret == 0)
    {
        //child进程
        printf("I am child : %d, ret: %d\n",getpid(), ret);
    }
    else
    {
        //father进程
        printf("I am father : %d, ret: %d\n"getppid(), ret);
    } 
    sleep(1);
    return 0;
}

进程状态

进程有着不同的状态，我们需要知道进程的不同状态。一个进程可以有几个状态：

"R(running)", /*0*/ R运行状态：并不意味程序一定在运行中，它表明进程要么在运行队列里要么在运行
"S(sleeping)",/*1*/ S睡眠状态：意味着进程在等待事件完成（这里的睡眠有时候也可叫做中断睡眠）
"D(disk sleep)",/*2*/ D磁盘休眠状态有时候也叫做不可中断睡眠状态，在这个状态的进程通常会等待IO的结束
"T(stopped)",/*4*/T停止状态，可以通过发送SIGSTOP信号给进程来停止（T）进程。这个被暂停的进程可以通过发送SIGCONT信号让进程继续运行
"t(tracing stop)",/*8*/
"X(dead)",/*16*/X死亡状态，这个状态只是一个返回状态，我们不能在任务列表看到这个状态
"Z(zombie)",/*32*/ 下面会详细讲解

进程状态查看

ps aux / ps axj    命令

僵尸进程 Z(zombie)

僵死状态是很特殊的状态。当进程退出并且父进程没有读取到子进程退出的返回代码时就会产生僵尸进程
僵尸进程会以终止状态保持在进程表中，并且会一直在等待父进程读取退出状态代码
所以，只要子进程退出，父进程还在运行，但父进程没有读取子进程状态，子进程进入Z状态

举一个产生僵尸进程的例子

#include<stdio.h>
#include<stdlib.h>

int main()
{
    pid_t id = fork();
    if(id < 0)
    {
        perror("fork");
        return 1; 
    }
    else if(id > 0)
    {
        //parent进程
        printf("parent[%d] is sleeping...\n",getppid());
        sleep(30);
    }    
    else
    {
        printf("child[%d] is begin Z...\n",getpid());
        sleep(5);
        exit(EXIT_SUCCESS);
    }
    return 0;
}

僵尸进程的危害

进程的退出状态必须被维持下去，因为他要告诉关心它的进程（父进程），可是父进程如果一直不读取，那么子进程就会一直处于Z状态
维护退出状态需要数据维护，也属于进程的基本信息，所以保存在task_struct中，进程不退出，task_struct就要一直维护
如果一个父进程创建了很多子进程，就是不回收，就会造成内存资源的浪费，因为数据结构对象本身就要占用内存。
还会造成内存泄露

孤儿进程

父进程如果提前退出，那么子进程后退出，进入Z之后，会怎么处理？
父进程先退出，子进程就称之为孤儿进程
孤儿进程被1号进程init进程领养，当然要有init进程回收

#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
 
int main()
{
     pid_t id = fork();
     if(id < 0)
     {
         perror("fork");
         return 1;
     }
     else if(id == 0)
     {   
         //child
         printf("I am child, pid : %d\n", getpid());
         sleep(10);
     }
     else
     {   
         //parent
         printf("I am parent, pid: %d\n", getpid());
         sleep(3);
         exit(0);
     }
     return 0;
}

进程优先级

基本概念

cpu资源分配的先后顺序，就是指进程的优先权
优先权高的进程有优先执行权利。配置进程优先权对多任务环境的linux很有用，可以改善系统性能
还可以把进程运行到指定的CPU上，所以可以把不重要进程安排到某个CPU，可以大大改善系统整体性能

查看系统进程

用ps -l 命令可以输出系统进程

UID：代表执行者的身份
PID：代表这个进程的代号
PPID：代表这个进程是由哪个进程发展衍生而来的，也就是父进程
PRI：代表这个进程可被执行的优先级，其值越小越早被执行
NI：代表这个进程的nice值

PRI 和 NI

PRI即进程的优先级，或者就是程序被CPU执行的先后次序，这个值越小代表进程的优先级别越高
NI就是所说的nice值，表示进程可被执行的优先级的修正数值
PRI值越小越快被执行，加入nice值后PRI值会改变 PRI(new) = PRI(old) + nice
当nice值为负值的时候，那么该程序将会优先级值将变小，即优先级会变高，则其越快被执行
所以，调整进程的优先级，在linux下，就是调整进程nice值
nice其取值范围是-20到19，一共有40个级别

查看进程优先级别的命令

用top命令更改已存在进程的nice

top
进入top后按“r”->输入进程的PID->输入nice值

其他概念

竞争性：系统进程数目众多，而CPU资源只有少量，所以进程之间是由竞争性的，为了高效完成任务，更合理竞争相关资源，便具有了优先级
独立性：多进程运行，需要独享各种资源，多进程运行期间互不干扰
并行：多个进程在多个CPU下分别，同时进行运行，这称之为并行
并发：多个进程在一个CPU下采用进程切换的方式，在一段时间之内，让多个进程得以推进，称之为并发

环境变量

概念

环境变量一般是指在操作系统重用来指定操作系统运行环境的一些参数
比如我们写代码的时候，在链接的时候，不知道我们所链接的动静态库在哪里，但是还是可以链接成功，生成可执行程序，原因就是有相关环境变量在帮助编译器进行查找
环境变量通常具有某些特殊用途，在系统当中通常具有全局特性

常见环境变量

PATH：指定命令的搜索路径
HOME：指定用户的主工作目录（即用户登录到Linux系统中时，默认的目录）
SHELL：当前Shell，它的值通常是/bin/bash

查看环境变量的方法

echo $NAME //NAME是指环境变量名称

和环境变量相关的命令

echo：显示某个环境变量的值
export：设置一个新的环境变量
env：显示所有环境变量
unset：清除环境变量
set：显示本地定义的shell变量和环境变量

环境变量的组织方式

每个程序都会收到一张环境表，环境表是一个字符指针数组，每个指针指向一个以‘\0’结尾的环境字符串

通过代码获取环境变量

方法一：命令行的第三个参数

#include<stdio.h>

int main(int argc, char* argv[], char* env[])
{
    int i = 0;
    for(; env[i]; i ++)
    {
        printf("%s\n",env[i]);
    }
    return 0;
}

方法二：通过第三方变量environ获取

#include<stdio.h>

int main(int argc, char* argv[])
{    
    extern char** environ;
    int i = 0;
    for(; environ[i]; i++)
    {
        printf("%s\n", environ[i]);
    }
    return 0;
}

libc中定义的全局变量environ指向环境变量表，environ没有包含在任何头文件中，所以在使用时要用extern声明

通过系统调用获取或者设置环境变量

#include<stdio.h>
#include<stdlib.h>

int main()
{
    printf("%s\n",getenv("PATH"));
    return 0;
}

环境变量通常是具有全局特性的

通常环境变量可以被子进程继承下去

#include<stdio.h>
#include<stdlib.h>

int main()
{
    char* env = getenv("MYENV");
    if(env)
    {
        printf("%s\n", env);
    }
    return 0;
}

发现没有结果，说明该环境变量根本不存在

导出环境变量
export MYENV="hello world"
再次运行程序，发现结果存在，说明环境变量是可以被子进程继承下去的

程序地址空间

看接下来的一段代码：

#include<stdio.h>
#include<unistd.h>
#include<stdlib.h>

int g_val = 0;

int main()
{
    pid_t id = fork();
    if(id < 0)
    {
        perror("fork");
        return 0;
    } 
    else if(id == 0)
    {
        //child进程
        printf("child[%d]: %d : %p\n",getpid(), g_val, &g_val);
    }
    else
    {
        //parent进程
        printf("parent[%d]: %d : %p\n",getppid(), g_val,&g_val);
    }
    sleep(1);
    return 0;
}

我们可以发现，输出的地址是一样的，因为子进程按照父进程为模版，父子并没有对变量进行任何修改，但是代码改动一下：

#include<stdio.h>
#include<unistd.h>
#include<stdlib.h>

int g_val = 0;

int main()
{
    pid_t id = fork();
    if(id < 0)
    {
        perror("fork");
        return 0;
    } 
    else if(id == 0)
    {
        //child进程
        g_val = 100;
        printf("child[%d]: %d : %p\n",getpid(), g_val, &g_val);
    }
    else
    {
        //parent进程
        sleep(3);
        printf("parent[%d]: %d : %p\n",getppid(), g_val,&g_val);
    }
    sleep(1);
    return 0;
}

我们可以发现：父子进程，输出的地址是一致的，但是变量的内容不一样，所以可以得出以下结论：

变量内容不一样，所以父子进程输出的变量不是同一个变量
地址却是一样的，说明这个地址不是物理地址
这种地址在Linux下被叫做虚拟地址
我们用C/C++语言所看到的地址，全部都是虚拟地址，用户看不见的，由操作系统统一管理
操作系统负责将虚拟地址转化为物理地址

原文地址：https://blog.csdn.net/zjx_web_c/article/details/137351589

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

多路复用——select
基于select机制的多路复用技术
阅读更多2024-10-10
速卖通、敦煌卖家备战双11+黑五前，怎么增加店铺曝光？
当排名不断提高，带来的流量也会增加，更多的买家将看到商品，进而促成订单量的快速增长。可以获得更多的自然搜索推荐机会，进而提高产品的曝光率和转化率，产品的购买率和评价对于转化率和平台排名至关重要。为了吸
阅读更多2024-10-10
安全工具 | 搭建带有 Web 仪表板的Interact.sh
Interactsh 是一个用于检测带外交互的开源工具。它是一种旨在检测导致外部交互的漏洞的工具。本文将主要介绍在子域上设置私有 Interact.sh 服务器以及部署其 Web 应用程序。只需一个
阅读更多2024-10-10
双向数据绑定原理图
在这里插入图片描述](https://i-blog.csdnimg.cn/direct/1930d5bf4f084d97aa62e72ef9d30e4e.pn。通知所有Watcher。用户看到更新后的
阅读更多2024-10-10
windows启微服务端口被占用情况的排查与解决方法
问题如下根据错误信息，问题出现在尝试启动服务器时，遇到了端口已被占用的情况（这意味着尝试绑定的端口19200已经被另一个进程占用了。
阅读更多2024-10-10
LabVIEW提高开发效率技巧----状态保存与恢复
在LabVIEW开发中，保存和恢复程序运行时的状态是一个关键技巧，特别是在涉及需要暂停或恢复操作的应用中。通过使用和函数，开发人员可以将程序当前的状态转换为字符串并保存，再在需要时恢复这些状态，确保程
阅读更多2024-10-10
JavaScript七大常见陷阱深度解析
JavaScript作为Web开发中的核心语言，因其灵活性和动态性而备受青睐。然而，这种灵活性也带来了一些常见的陷阱，稍有不慎便可能引发难以追踪的错误。以下是七个常见的JavaScript陷阱，帮助开
阅读更多2024-10-10
MySQL 多条件查询
在 MySQL 中，多条件查询通常使用WHERE子句来指定多个条件。这些条件可以通过逻辑运算符（如ANDORNOT）进行组合，以实现复杂的查询需求。
阅读更多2024-10-10
Windows10如何关闭自动更新
4. 点击"恢复"选项卡，将"第一次失败"、"第二次失败"、"后续失败"都改为"无操作"，然后点击&
阅读更多2024-10-10
Linux 互斥锁
互斥锁的使用、线程同步和互斥、条件变量的使用 ...
阅读更多2024-10-10