python多进程库（multiprocessing）

🕗 发布于 2024-07-22 16:06 python 开发语言

multiprocessing本身是Python的多进程库，用来处理与多进程相关的操作。但是由于进程与进程之间不能直接共享内存和堆栈资源，而且启动新的进程开销也比线程大得多，因此使用多线程来爬取比使用多进程有更多的优势。multiprocessing下面有一个dummy模块，它可以让Python的线程使用multiprocessing的各种方法。

dummy下面有一个Pool类，它用来实现线程池。这个线程池有一个map()方法，可以让线程池里面的所有线程都“同时”执行一个函数。

例如计算0～9的每个数的平方。

在学习了for循环之后，代码可能会写成这样：

for i in range(10):

print(i ** i)

这种写法当然可以得到结果，但是代码是一个数一个数地计算，效率并不高。而如果使用多线程的技术，让代码同时计算很多个数的平方，就需要使用multiprocessing.dummy来实现：

 from multiprocessing.dummy import Pool
  def calc_power2(num):
     return num * num
 pool = Pool(3)
 origin_num = [x for x in range(10)]
 result = pool.map(calc_power2, origin_num)
 print(f'计算0-9的平方分别为：{result}')

在上面的代码中，先定义了一个函数用来计算平方，然后初始化了一个有3个线程的线程池。这3个线程负责计算10个数字的平方，谁先计算完手上的这个数，谁就先取下一个数继续计算，直到把所有的数字都计算完成为止。

总结一下这个多线程用法

from multiprocessing.dummy import Pool
def hanshu(canshu):
    return canshu+2

xiancheng = Pool(3)
canshujihe = [1,2,3,4,5]

shuchujieguo = xiancheng.map(hanshu,canshujihe)

print(shuchujieguo)

from multiprocessing.dummy import Pool
这一行表示导入库模块

def hanshu(canshu):
    return canshu+2
上面两行是一个函数，函数有参数，有返回值
xiancheng = Pool(3)
设置几个线程，这里设置了3个线程
canshujihe = [1,2,3,4,5]
这里弄了一个参数的集合
shuchujieguo = xiancheng.map(hanshu,canshujihe)
输出的结果=线程设置.map（函数名不含括号，参数集合）
print(shuchujieguo)

打印结果

原文地址：https://blog.csdn.net/wwwcaifeng/article/details/140588023

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：springboot个体快餐订单系统-计算机毕业设计源码13441
下一篇：AWS认证SAA-C03每日一题

EI-BISYNCH协议，欧陆2000系列设备读取数据
EI-Bisynch是一种基于ANSI X3.28-2.5 A4标准的专有协议，用于消息框架。尽管其名称中包含“Bisynch”，但它实际上是一种基于ASCII的异步协议。数据通过7位数据位、偶校验和
阅读更多2024-09-21
Qt/C++ 多线程同步机制详解及应用
在多线程编程中，线程之间共享资源可能会导致数据竞争和不一致的问题。因此，采用同步机制确保线程安全至关重要。
阅读更多2024-09-21
IP Source Guard技术原理与应用
打开 IP Source Guard 功能可能会影响 IP 报文的转发，一般情况下，该功能需要结合 DHCP Snooping 功能使用，IP Source Guard和DHCP Snooping功能
阅读更多2024-09-21
堆的向下调整算法和TOPK问题
首先堆是一种完全二叉树，它一定满足所有的根结点都大于或小于它的左右子树如果是大堆，那么堆顶的数就是堆中最大的数如果是小堆，那么堆顶的数就是堆中最小的数堆常常用来解决排序和TOPK问题对于完全二叉树而已
阅读更多2024-09-21
在Windows环境下设置SSH克隆GitHub仓库
如果连接成功，你会看到类似“Hi username!You've successfully authenticated, but GitHub does not provide shell acces
阅读更多2024-09-21
基于JAVA+SpringBoot+Vue的智能无人仓库管理
采用智能无人仓库管理可以有效管理，使信息管理能够更加科学和规范。智能无人仓库管理在Eclipse环境中，使用Java语言进行编码，使用Mysql创建数据表保存本系统产生的数据。总之，智能无人仓库管理集
阅读更多2024-09-21
powerbi -L10-文件夹内的文件名
powerbi -L10-文件夹内的文件名。
阅读更多2024-09-21
PowerBI-l5-CALENDAR创建日期表
CALENDAR创建日期表。
阅读更多2024-09-21
PowerShell install 一键部署Oracle21c-xe
Oracle Database 23ai Free 让您可以充分体验 Oracle Database 的能力，世界各地的企业都依赖它来处理关键任务工作负载。Oracle Database Free 的
阅读更多2024-09-21
【架构设计】多级缓存：应用案例与问题解决策略
多级缓存系统的工作原理及其在提升应用性能方面的关键作用。通过对比本地缓存与分布式缓存的特点多级缓存系统作为性能优化的重要组成部分，通过在不同层级存储数据，有效提升了应用程序的响应速度。这种策略主要包括
阅读更多2024-09-21

python多进程库（multiprocessing）

相关文章