为什么Python多处理.Process()传递队列参数并且读取比函数传递队列参数和读取更快

发布于02月28日

在Python中，我实现了两种类型的队列读取

不同之处:

在主进程中创建并执行队列
队列在主进程中创建，并由其他进程执行.

但是有一个性能差异，我试着调试它，但我看不出为什么！

代码: Queue1.py

import multiprocessing
import time
import cProfile, pstats, io


def put_queue(queue):
    for i in range(500000):
        queue.put(i)

def get_queue(queue):
    pr = cProfile.Profile()
    pr.enable()
    print(queue.qsize())
    while queue.qsize() > 0:
        try:
            queue.get(block=False)
        except:
            pass
    pr.dump_stats("queue1.prof")
    pr.disable()
    s = io.StringIO()
    sortby = "cumtime"
    ps = pstats.Stats(pr, stream=s).sort_stats(sortby)
    ps.print_stats()
    print(s.getvalue())


q1 = multiprocessing.Queue()
t1 = time.time()
put_queue(q1)
t2 = time.time()
print(t2-t1)

t1 = time.time()
p1 = multiprocessing.Process(target=get_queue, args=(q1,))
p1.start()
p1.join()
t2 = time.time()
print(t2-t1)

Queue2.py

import multiprocessing
import time
import cProfile, pstats, io


def put_queue(queue):
    for i in range(500000):
        queue.put(i)


def get_queue(queue):
    pr = cProfile.Profile()
    pr.enable()
    print(queue.qsize())
    while queue.qsize() > 0:
        try:
            queue.get(block=False)
        except:
            pass
    pr.dump_stats("queue2.prof")
    pr.disable()
    s = io.StringIO()
    sortby = "cumtime"
    ps = pstats.Stats(pr, stream=s).sort_stats(sortby)
    ps.print_stats()
    print(s.getvalue())


q2 = multiprocessing.Queue()
t1 = time.time()
put_queue(q2)
t2 = time.time()
print(t2 - t1)

t1 = time.time()
get_queue(q2)
t2 = time.time()
print(t2 - t1)

python Queue2.py takes longer than queue1.py

我还会打印个人资料. enter image description here个

Queue2.py cost muth time in built-in method posix.read.

我想知道确切的原因.

from multiprocessing import Queue, Process import time N = 500_000 def putter(queue): for i in range(N): queue.put(i) def getter(queue): for i in range(N): queue.get() def benchmark1(queue): t = time.time() putter(queue) getter(queue) elapsed = time.time() - t print('benchmark 1 time:', elapsed) def benchmark2(queue): t = time.time() putter(queue) p = Process(target=getter, args=(queue,)) p.start() p.join() elapsed = time.time() - t print('benchmark 2 time:', elapsed) if __name__ == '__main__': queue = Queue() benchmark1(queue) benchmark2(queue)

为什么Python多处理.Process()传递队列参数并且读取比函数传递队列参数和读取更快

推荐答案

Python相关问答推荐

从webhook中的短代码(而不是电话号码)接收Twilio消息

Polars比较了两个预设-有没有方法在第一次不匹配时立即失败

对整个 pyramid 进行分组与对 pyramid 列子集进行分组

如何获取TFIDF Transformer中的值？

基于字符串匹配条件合并两个帧

如果值发生变化，则列上的极性累积和

joblib：无法从父目录的另一个子文件夹加载转储模型

Python列表不会在条件while循环中正确随机化'

名为main. py的Python模块在导入时不运行'

Matplotlib中的字体权重

Python—压缩叶 map html作为邮箱附件并通过sendgrid发送

如何使用正则表达式修改toml文件中指定字段中的参数值

利用SCIPY沿第一轴对数组进行内插

在pandas中，如何在由两列加上一个值列组成的枢轴期间或之后可靠地设置多级列的索引顺序，

无法在盐流道中获得柱子

如何在Pandas中用迭代器求一个序列的平均值？

Django更新视图未更新

某些值的数值幂和**之间的差异

PyTorch变压器编码器中的填充掩码问题

Pandas查找给定时间戳之前的最后一个值