python的多线程和多进程

🕗 发布于 2024-10-17 21:48 python

首先需要明确的是，多进程和其他语言的一样，能够利用多核cpu，但是python由于GIL的存在，多线程在执行的时候，实际上，每一时刻只有一个线程在执行。相当于是单线程。然而多线程在某些情况下，还是能够起到加速的效果。

需要了解的是，程序的耗时一般消耗在IO和CPU上，按照占比不同，一般分为IO密集型或者CPU密集型。比如文件读写、网络传输，磁盘IO等，属于IO密集型，而矩阵计算、数值计算这种就属于CPU密集型。在单线程中，遇见IO操作的时候，CPU会阻塞，直到IO操作完成，花费的时间成本为IO耗时加CPU耗时。但是在多线程中，遇见IO操作的时候，该线程会交出GIL，其他线程可以继续运行，这样可以让CPU和IO并行。因此，如果是IO密集型，即在代码中，主要是进行IO读取，那么多线程仍然能够起到加速左右，值得注意的是，这里的加速效果应该是来自于处理IO的设备，支持并行IO，即同一时刻，能够处理多个IO请求。反之，如果是CPU密集型，IO耗时忽略不计的话，此时多线程相当于是单线程，同时考虑到线程的上下文切换，那么多线程的运行时间反而会更多。

线程池的使用方法submit和map

python中concurrent.futures这个类提供了线程池和进程池的接口。as_completed按照任务的完成时间返回，map按照任务的添加时间返回

我们可以通过submit或map添加任务，但使用起来存在细微差别。

一般通过submit得到一个包含future对象的列表，然后通过concurrent.futures.as_completed去遍历这个列表，该方法会阻塞，可以设置超时时间。每当有任务完成的时候，就能通过future.result()得到任务执行的结果，该方法同样会阻塞，可以设置超时时间。因此通过这种方法，输出是按照任务执行完成的时间排序的。

当然，我们也可以不用as_completed去遍历，这样就按照任务的顺序返回。因为每个任务如果没完成就阻塞，完成了就添加。

import concurrent.futures
import time


def task(times):
    # 模拟任务执行
    time.sleep(times)
    return times

def main():
    num_threads = 3
    with concurrent.futures.ThreadPoolExecutor(max_workers=num_threads) as executor:
        # 提交任务到线程池
        # submit
        futures = [executor.submit(task, t) for t in [7, 1, 3, 8]]
        # # 收集每个任务的结果
        results = []
        # for future in concurrent.futures.as_completed(futures):
        #     result = future.result()
        #     results.append(result)
        for future in futures:
            result = future.result()
            results.append(result)
        # map
        # results = []
        # futures = executor.map(task, [7, 1, 3, 8])
        # for future in futures:
        #     results.append(future)
    print(f"results = {results}")


if __name__ == "__main__":
    main()

上面两种submit，依次输出1 3 7 8和7 1 3 8

map函数则不太一样，第一个参数是需要线程执行的函数，第二个参数是一个迭代器，会依此将参数应用到线程函数中。返回结果和列表的顺序一样。返回7 1 3 8

多线程和多进程的对比

在这里插入图片描述

线程安全

import concurrent.futures
import random
from threading import Lock
import time

# 共享变量
shared_variable = 0
# 锁对象，用于保护共享变量的访问
lock = Lock()

def task(task_id):
    global shared_variable
    # 模拟任务执行
    # 获取锁，确保对共享变量的访问是线程安全的
    for _ in range(1000000):
        with lock:
            shared_variable += 1
        # shared_variable += 1
    

def main():
    num_threads = 2

    with concurrent.futures.ThreadPoolExecutor(max_workers=num_threads) as executor:
        # 提交任务到线程池
        futures = [executor.submit(task, i) for i in range(2)]
        
        # 收集每个任务的结果
        results = []
        for future in concurrent.futures.as_completed(futures):
            result = future.result()
            results.append(result)
    print(f"results = {results}")
    print(f"shared_variable = {shared_variable}")

if __name__ == "__main__":
    main()

注释掉上面代码的lock，试试加锁和不加锁，可以很清晰的看到，加锁的时候不会有竞争冒险，而不加锁则可能有竞争冒险。因为几率是比较小的，观察不到的话，可以加大循环的次数。

原文地址：https://blog.csdn.net/qq_40896190/article/details/143027165

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：[python]从零开始的API调用教程
下一篇：简述RESTFul风格的API接口

如何用示波器检测次级点火系统（一）
单看标题可能会让你觉得这篇文章的主题是关于检测线圈，火花塞和火花塞插头电线。但我们指的是分析燃烧室内电子的行为。目标是看燃料混合物，阀座，压缩，积碳和其它影响这种特性的症状。最终目的是要学会分析示波器
阅读更多2024-10-18
JavaWeb合集03-Maven
bin：存放的是可执行文件，如：测试、打包、编译等这些指令。conf：存放配置文件的，配置本地仓库和阿里云私服就就在settings.xml文件下配置lib：存放的是maven它所依赖的一些jar包文
阅读更多2024-10-18
[k8s理论知识]2.docker基础（一）
PaaS项目被广泛接受的原因是他们提供了一种应用托管的能力。在PaaS出现之前，虚拟机和云计算已经是很普遍的技术和服务。主流做法是租用一批AWS或openstack的虚拟机，然后像管理物理服务器一样，
阅读更多2024-10-18
Maven概述
Maven【[ˈmevən]】这个词可以翻译为"专家","内⾏"。作为Apache组织中的⼀个颇为成功的开源项⽬，Maven主要服务于基于java平台的项⽬构
阅读更多2024-10-18
docker 初步理解
例如在一些基础层当中，原本有了一些环境，比如java、tomcat、maven，然后我们需要再去安装一些redis、mysql或者是python等等，那么就只需要在层的概念上，添加上一层需要添加的环境
阅读更多2024-10-18
得物iOS函数调用栈及符号化调优实践｜得物技术
伴随得物用户规模和业务复杂度不断提升，应用上线前的隐私合规检测愈发重要；当前得物版本灰度前的合规检测正在向着规模化、自动化发展，其中动态检测的性能和效率瓶颈也越发凸显。因此iOS端符号化堆栈采集的难点
阅读更多2024-10-18
本地项目上传Github+Gitee上传特定分支到Linux服务器（自用）
git init。
阅读更多2024-10-18
JavaWeb合集11-Maven高级
当分模块开发时，需要对项目进行打包，这时就会发现，相关联的模块没有下载到Maven中打包会失败，就需要一个一个模块的进行下载（install）到Maven仓库中，比较繁琐。注意：聚合工程中所包含的模块
阅读更多2024-10-18
【java】docker里的tomcat容器的java程序生成日志时间和日期不对，或者，java程序获取的时间日期不对；解决方案4步解决
【java】docker里的tomcat容器的java程序生成日志时间和日期不对，或者，java程序获取的时间日期不对；解决方案4步解决
阅读更多2024-10-18
mac git管理（新）
1.本地生成ssh key添加到远程gitlab上。3.再git clone 就可以了。本地拉取gitlab地址报错。
阅读更多2024-10-18

python的多线程和多进程

线程池的使用方法submit和map

多线程和多进程的对比

线程安全

相关文章