线程（二）【线程控制】

🕗 发布于 2024-11-16 13:46 linux c++ 多线程线程控制

而由于 linux 这款操作系统的线程，是通过进程的内核数据结构模拟的，在 linux 中没有针对线程设计新的内核数据结构，只有所谓轻量级进程的概念，所以就注定了 linux 系统没有向上层用户提供关于线程接口的系统调用。而作为上层用户，确实有对多线程编码的需求，因此 linux 开发程序员就在应用层开发了一个线程库（编译时需要手动链接库，因为 pthread 不是系统库，也不是语言库，是第三方库)，为用户来提供控制线程的相关接口。

1. 创建线程

NAME
      pthread_create - create a new thread

SYNOPSIS
      #include <pthread.h>

      int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *(*start_routine) (void *), void *arg);

      Compile and link with -pthread.

RETURN VALUE// 成功返回 0，识别返回 errno，但是 errno 不会被设置
       On success, pthread_create() returns 0; on error, it returns an error number, and  the  con‐tents of *thread are undefined.

thread：一个输出型参数，返回线程ID
attr：设置线程的属性，attr 为 null 表示使用默认属性
start_routine：是个函数地址，线程启动后要执行的函数（即线程执行的代码块，可以理解为这个函数就是线程的入口函数）
void* 的返回类型是为了支持返回所有类型的指针，可以理解为 void* 是C式泛型
arg：传递给线程启动函数 start_routine 的参数

#include <iostream>
#include <pthread.h>
#include <unistd.h>

void *threadRun(void* args)
{
    while(1)
    {
        std::cout << "new thread: " << getpid() << std::endl;
        sleep(1);
    }
    return nullptr;     // 线程不会返回到 main 函数，执行完线程函数后 就退出了。
}

int main()
{
    pthread_t tid;
    pthread_create(&tid, nullptr, threadRun, nullptr);
    while(1)
    {
        std::cout << "main thread: " << getpid() << std::endl;
        sleep(1);
    }
}

在这里插入图片描述

现象：正如我们文章一开始的分析，线程是进程的一个执行分支，是在进程的地址空间内运行的，共享的是进程的资源，因此即便线程有自己的 task_struct，但它没有自己的 PID。

ps -aL: 查看当前用户启动的所有轻量级进程

并且当进程运行起来后，我们看到了两个执行流，它们两个的 LWP 是不一样的。我们之前一直说，操作系统是根据进程的 PID 进行调度的，其实不然，因为在如今的场景（多执行流），显然无法区分进程和线程。操作系统是根据 LWP 对执行流进行调度的。

我们之前都是单进程单执行流的情况，所以我们之前说是根据 PID 进行调度的也没错，因为主线程的 PID 与 LWP 是一致的，根据 PID 或者 LWP 对主线程调度，效果都是一样的。而为什么主线程的 PID 与 LWP 是一致的，因为它是第一个被创建的，程序运行起来就被创建了。

在这里插入图片描述

现象：无论是对主线程发送 9 号信号，还是对新线程，整个进程都是直接被干掉，这就是我们在线程（一）【理论篇】所说的，由于线程是进程的一个执行分支，所以无论哪个线程异常（收到信号），本质就是进程收到信号，信号最终是由进程这个整体去处理的，因此最终影响的也是整个进程。这也说明了线程的健壮性很差，只有有一个执行流出问题了，整个进程就都完蛋。

int g_val = 0;
int main()
{
    pthread_t tid;
    pthread_create(&tid, nullptr, threadRun, nullptr);
    while(1)
    {
    printf("main thread pid: %d, g_val: %d, &g_val: 0x%p, create new thread tid: %p\n", getpid(), g_val, &g_val, tid);
        ++g_val;
        ...
    }
}

在这里插入图片描述

现象：主线程对全局变量做修改，新线程能够看到，即无论是否初始化，全局区的数据都是被多个线程所共享的。并且我们看到，所获取到的线程 tid 并不是 LWP，这是因为 LWP 是操作系统层的概念，即操作系统在内部对线程的标识符，用户不需要关心，用户只需要关心线程的 tid。

2. 线程等待

在 linux 系统中，关于父子进程谁先被操作系统调度，这是无法确定的，同理，线程在 linux 中是轻量级线程，主线程和新线程谁先被调度，也是无法确定的，都是取决于调度器。在父子进程中，父进程需要最后一个退出，因为它需要等待子进程退出后回收子进程，同样的，在多线程下，主线程也需要最后退出，因为它也需要等待它所创建出来的新线程，创建线程的本质是对线程做管理，所以主线程同样需要管理回收新线程。简言之，线程退出时也要被等待！

在父子进程体系中，如果父进程先退出，子进程退出时就无人等待回收，那么子进程就会一直陷入僵尸状态；类似的，如果主线程不对创建出来的线程做等待，那么新线程退出后，也会造成类似于僵尸进程的问题（虽然无法观察到这个问题）。

用户创建一个子进程，目的就是为了让子进程去执行任务，如果有需要，最后子进程退出时，要把执行情况告知上层用户；同样的，用户创建一个线程也是为了让线程去干活！所以如果用户需要，那么线程在退出时，也要把结果能够带回上层！

NAME
      pthread_join - join with a terminated thread

SYNOPSIS
      #include <pthread.h>

      int pthread_join(pthread_t thread, void **retval);

RETURN VALUE    
      On success, pthread_join() returns 0; on error, it returns an error number.
      
thread：线程ID
retval：指向一个指针，所指向的指针指向的是线程的返回值数据

void *threadRun(void* args)
{
...
    return (void*)100;     // 线程的退出结果由返回值带回
}

int main()
{
    pthread_t tid;
    pthread_create(&tid, nullptr, threadRun, nullptr);
    sleep(7);
    void* retval;
    pthread_join(tid, &retval);// main thread 默认是阻塞等待，即新线程不退，主线程就一直等
    cout << "main thread quit!" << (long long)retval << endl;   // 64位平台下指针8字节，强转int会发生数据截断，gcc报错

    return 0;
}

在这里插入图片描述

之前我们在介绍进程的创建、终止时说过，一个进程（执行流）执行的结果就三种情况：代码正常运行，结果正确；代码正常运行，结果不正确；代码运行时异常终止。

在线程函数内将线程的执行结果返回给主线程的前提是，代码正常运行没有出现异常，中间出现异常，就运行不到返回结果那一刻了。那线程出异常了怎么返回？怎么不像多进程那样在 wait 子进程时，可以通过 status 参数将异常终止信号以及退出结果返回给父进程。

线程确实可能存在代码运行时异常终止的情况，但是线程出异常，最终整个进程都会被干掉，可不像多进程体系，每个进程之间互相独立，互不影响。因此在线程等待 pthread_join 时不需要考虑线程异常的情况，线程的异常，最终会被该线程所属进程的父进程处理。

3. 线程终止

线程终止的其中一种方式，我们在线程等待时已经提及了，即线程函数执行完毕做返回时，就是线程的终止。

在介绍其它线程终止的方法时，我们先试试 exit 能不能让线程退出。

void *threadRun(void* args)
{
    ...
    exit(11);   
    return (void*)100;    
}
int main()
{
...
    pthread_join(tid, &retval);
    cout << "main thread quit!" << (long long)retval << endl; 
    return 0;
}

在这里插入图片描述

现象：“main thread quit!” 这条语句并没有被执行，证明在线程内 exit 时，线程确实退出了，但是整个进程也给干掉了。因为 exit 的作用是终止进程的，因此无法用于终止线程。

NAME
      pthread_exit - terminate calling thread// 终止一个线程，无返回值

SYNOPSIS
      #include <pthread.h>

      void pthread_exit(void *retval);// 终止线程时，于 pthread_join 相似，可以将线程的退出结果带回。

void *threadRun(void* args)
{
    ...
    pthread_exit((void*)100);   
}

在这里插入图片描述

需要注意的是，如果在主线程内直接 return 退出了，那么主线程创建的全部线程也就随之退出。

终止一个线程，还可以通过取消一个线程来完成。

NAME
      pthread_cancel - send a cancellation request to a thread// 向线程发送一个取消请求

SYNOPSIS
      #include <pthread.h>
       
      int pthread_cancel(pthread_t thread); // 传入线程的 tid 取消线程。目标线程必须是存在的。

int main()
{
    pthread_t tid;
    pthread_create(&tid, nullptr, threadRun, (void*)"Thread[1]");
    sleep(1);   // 1s后取消线程
    pthread_cancel(tid);
    ...
}

在这里插入图片描述

现象：由于主线程中设置了 1s 后取消 tid 目标线程，因此目标线程无法正常执行完毕。同时我们看到了线程的退出结果被默认设置为 -1，这是因为 pthread_cancel 的退出结果为 PTHREAD_CANCELED（一个宏），即 #define PTHREAD CANCELED((void *)-1) 。

4. 重谈线程函数及其参数

int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *(*start_routine) (void *), void *arg);

在创建线程的时候，不仅仅可以传递字符串参数给线程函数，包括各种类对象都是可以的，以及线程函数的返回值也可以是类对象这种。

接下来，我们创建一个线程并计算一段区间的累加和，计算过程和结果封装为类，作为线程函数的参数传递和返回值传出。

#include <iostream>
#include <pthread.h>
#include <unistd.h>
#include <cstdlib>
using namespace std;

class Response
{
public:
    Response(int result, int exitcode)
        :_result(result), _exitcode(exitcode)
    {}
public:  
    int _result;   // 计算结果
    int _exitcode; // 计算结果是否可靠
};

class Request
{
public:
    Request(int start, int end, const string &threadname)
        :_start(start), _end(end), _threadname(threadname)
    {}

    long long CalSum(Response* resp)
    {
        for(int i = _start; i <= _end; i++)
        {
            // cout << rq->_threadname << " is runing, caling..., " << i << endl;
            resp->_result += i;
            // usleep(100000);
        }
    }

public:   
    int _start;
    int _end;
    string _threadname;
};

void *sumCount(void *args) // 线程的参数和返回值，不仅仅可以传递一般参数，也可以传递对象
{
    Request *req = static_cast<Request*>(args);     
    Response *resp = new Response(0,0);
    req->CalSum(resp);
    delete req;
    return resp;
}

int main()
{
    pthread_t tid;
    Request* req = new Request(1, 100, "thread 1");
    pthread_create(&tid, nullptr, sumCount, req);

    void* ret;
    pthread_join(tid, &ret);
    Response *resp = static_cast<Response*>(ret);
    cout << "resp->result: " << resp->_result << ", exitcode: " << resp->_exitcode << endl;
    delete resp;
    return 0;
}

在这里插入图片描述

在这份案例中，我们在主线程中 new 了一个类对象传递给新线程，在新线程中也 new 了一个类对象传递给主线程，并且这些对象在主线程和新线程中都可见、可访问。这就说明了地址空间中的堆空间也是被线程所共享的资源！

5. 线程ID及进程地址空间布局

因为 Linux 内核中没有明确的线程的概念，只有轻量级进程的概念，所以操作系统也没有直接给上层提供线程控制的相关接口。但是操作系统中有一个 clone 接口用于创建轻量级进程。

NAME
      clone, __clone2 - create a child process

SYNOPSIS
      /* Prototype for the glibc wrapper function */

      #include <sched.h>

      int clone(int (*fn)(void *), void *child_stack, int flags, void *arg, ...
                 /* pid_t *ptid, struct user_desc *tls, pid_t *ctid */ );

*fn：指向线程执行函数的函数指针，pthread 库中的 pthread_create 创建一个线程时传递的线程函数就是用于给 clone 传递的
*child_stack：线程的自定义栈

只不过，这个 clone 系统接口，作为用户是无法直接使用的，所以被 pthraed 线程库所封装，供上层使用。而因为系统底层接口 clone 创建一个轻量级进程的参数需要，所以我们用户在使用线程库时，需要传递诸如线程的回调函数以及用户空间（线程执行的代码、运行过程中形成的临时变量等数据的存放空间）。所以这就说明了，虽然操作系统内部没有明确的线程的概念，但是在上层，我们是有的，我们在使用线程库的接口传递参数时，概念上就是，这是线程的回调函数，这是线程的栈空间等等。因此线程的概念是线程库来维护的！

因为线程库要维护上层用户对线程的所有概念（诸如线程的ID，线程的栈空间，各种字段属性等等）

线程库是一个动态库，所以当我们在执行线程库的代码时，线程库也要被加载到内存中！而线程是在进程内执行的，是进程的一个执行分支，所以这个线程库最终经过页表映射到进程的地址空间中的共享区！当我们在进程中创建一个线程，那么在 pthread 库中就要给我们开辟一段空间，用于充当新线程的栈空间，即，线程的栈空间是在地址空间的共享区中的。

而诸如线程中的线程 ID、栈空间的大小、线程执行的回调函数的地址、线程的时间片、线程的状态等字段属性，linux 操作系统并不关心，因为 linux 中并没有线程这个概念，即线程的概念是线程库来维护的（因为 linux 没有线程的概念，所以它可以不关心，但作为用户需要关心线程的诸多属性，所以线程库需要把用户关心的线程的诸多字段属性给维护起来），这也是为什么我们在调用线程库接口时，需要我们传递线程 ID，设置线程的属性，回调函数等字段。

而不同的进程都能够调用线程库创建线程，因此在系统底层就都需要调用 clone 接口来维护上层创建线程时的独立的栈结构。因此线程库中存在多个线程，那么线程库就需要对这些创建出来的线程做管理。

当上层调用线程库接口创建一个线程，那么线程库就需要在自己库里面创建一个库级别的线程控制块，用于描述线程的回调函数的地址、线程的独立栈空间地址、线程的 LWP 指向内核中的执行流控制块等字段。所以用户在访问线程时，只需要找到这个线程（即提供线程ID），那么线程这个执行流就会被操作系统在底层自动调度。而对于这种 由用户层维护的线程，我们称为用户级线程。

在这里插入图片描述

用户级线程中的 tcb 里面包含了很多用户关心的线程的属性字段，并且每个线程都有这个结构。即以 tcb 这样的结构在上层把线程的概念描述起来，再通过数组的形式将上层创建的每一个线程进行组织管理。再者，可能用户创建的线程很多，那么就有在线程库中就会存在很多的 tcb，为了人用户快速的找到指定的 tcb，就有了所谓的线程 tid ---- tcb 在地址空间中的起始地址。将来用户想要访问线程、获取线程的属性等操作，都能通过向线程接口传递 tid 完成。再具体一点，所谓的 tid，就是地址空间中共享区的某一个地址。

为什么每个线程在运行时都有自己独立的栈结构

因为每一个线程都会有独立自己的调用链（即线程从执行到退出整个过程都调用了哪些函数），而栈结构会保存任何一个执行流，在运行过程中所有的临时变量，比如压栈时、传参时、函数返回时，以及函数内部定义的各种临时变量。

主线程是直接使用地址空间提供的栈区的，可以理解为这种线程就是真进程，而我们用户自己通过线程库所创建的各种线程，则是所谓的轻量级进程。在创建这种轻量级进程时，首先在线程库中创建描述线程的线程控制块 tcb，tcb 的起始地址即线程 ID，还有线程独立的栈结构，之后调用系统中的 clone 创建执行流，然后把线程的各字段传递给 clone，包括线程的栈结构。换言之，所有非主线程的栈都在线程库/共享区中进行维护。

如果感觉该篇文章给你带来了收获，可以点赞👍 + 收藏⭐️ + 关注➕ 支持一下！

感谢各位观看！

原文地址：https://blog.csdn.net/Crazy_Duck_Weng/article/details/142213473

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：你可以通过以下步骤找到并打开 **Visual Studio 开发者命令提示符**：
下一篇：opencv kdtree & pcl kdtree 效率对比

特权帐户安全 CyberArk
它隔离、控制和监控整个数据中心的所有特权活动，补充了CyberArk在市场领先的特权身份管理套件‌。‌CyberArk PTA（Privileged Threat Analytic）‌：特权威胁分析，
阅读更多2024-11-16
消息中间件分类
1. JMS（Java Message Service）：这是 Java 平台上的一套消息服务 API 标准，它定义了消息系统的基本功能，如消息的创建、发送、接收和读取等。5. 其他消息中间件：除了上
阅读更多2024-11-16
企业知识中台：构建智慧企业的核心
知识中台是企业数字化转型的重要一环，它能够帮助企业更有效地管理和利用知识资产，提升企业的竞争力。在选择搭建知识中台的工具时，HelpLook是一个值得考虑的选择。HelpLook以其直观易用的内容管理
阅读更多2024-11-16
如何恢復電腦IP地址的手動設置？
如何恢復電腦IP地址的手動設置。
阅读更多2024-11-16
OSPF动态路由配置(Cisco Packet Tracer)
OSPF路由协议通过向全网扩散本设备的链路状态信息，使网络中每台设备最终同步一个具有全网链路状态的数据库，然后路由器采用OSPF算法，以自己为根，计算到达其他网络的最短路径，最终形成全网路由信息。（4
阅读更多2024-11-16
HarmonyOS ArkTs 解决流式传输编码问题
使用 HarmonyOS ArkTs 解决流式传输中的编码和 JSON 解析问题。
阅读更多2024-11-16
每日论文20-24RFIC四核三模带自动模式跟踪输出缓冲器的VCO
每日论文20-24RFIC四核三模带自动模式跟踪输出缓冲器的VCO
阅读更多2024-11-16
PG数据库数据库时间字段开始时间和结束时间，判断和查询条件的开始和截止时间存在交集，SQL如何编写
假设你的表名是 events，开始时间字段为 start_time，结束时间字段为 end_time，而你要检查的时间段是 query_start_time 和 query_end_time。在 Po
阅读更多2024-11-16
cls(c基础)
作用清屏格式#include
阅读更多2024-11-16
see的本质是什么？
如果你喜欢看【龙虎斗】，看【猫蛇大战】相关的视频，你会发现，蛇的头会跟随性地转动，这不仅是因为蛇很紧张，更重要的，是因为蛇的眼睛的问题，蛇的眼睛对稍远一点的东西，其实是看不太清楚的，而且蛇的眼睛是没有
阅读更多2024-11-16

线程（二）【线程控制】

目录

1. 创建线程

2. 线程等待

3. 线程终止

4. 重谈线程函数及其参数

5. 线程ID及进程地址空间布局

相关文章