python多线程和多进程的对比-电子发烧友网

1. 基本概念

在开始讲解理论知识之前，先过一下几个基本概念。虽然咱是进阶教程，但我也希望写得更小白，更通俗易懂。

串行：一个人在同一时间段只能干一件事，譬如吃完饭才能看电视；

并行：一个人在同一时间段可以干多件事，譬如可以边吃饭边看电视；

在Python中，多线程 和 协程 虽然是严格上来说是串行，但却比一般的串行程序执行效率高得很。一般的串行程序，在程序阻塞的时候，只能干等着，不能去做其他事。就好像，电视上播完正剧，进入广告时间，我们却不能去趁广告时间是吃个饭。对于程序来说，这样做显然是效率极低的，是不合理的。

虽然 多线程 和 协程 已经相当智能了。但还是不够高效，最高效的应该是一心多用，边看电视边吃饭边聊天。这就是我们的 多进程 才能做的事了。

2. 单线程VS多线程VS多进程

文字总是苍白无力的，不如用代码直接来测试一下。

开始对比之前，首先定义四种类型的场景

- CPU计算密集型

- 磁盘IO密集型

- 网络IO密集型

- 【interwetten与威廉的赔率体系】IO密集型

为什么是这几种场景，这和多线程 多进程的适用场景有关。结论里，我再说明。

# CPU计算密集型
def count(x=1, y=1):
    # 使程序完成150万计算
    c = 0
    while c < 500000:
        c += 1
        x += x
        y += y


# 磁盘读写IO密集型
def io_disk():
    with open("file.txt", "w") as f:
        for x in range(5000000):
            f.write("python-learning\n")


# 网络IO密集型
header = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36'}
url = "https://www.tieba.com/"

def io_request():
    try:
        webPage = requests.get(url, headers=header)
        html = webPage.text
        return
    except Exception as e:
        return {"error": e}


# 【模拟】IO密集型
def io_simulation():
    time.sleep(2)

比拼的指标，我们用时间来考量。时间耗费得越少，说明效率越高。

为了方便，使得代码看起来，更加简洁，我这里先定义是一个简单的 时间计时器 的装饰器。如果你对装饰器还不是很了解，也没关系，你只要知道它是用于计算函数运行时间的东西就可以了。

def timer(mode):
    def wrapper(func):
        def deco(*args, **kw):
            type = kw.setdefault('type', None)
            t1=time.time()
            func(*args, **kw)
            t2=time.time()
            cost_time = t2-t1
            print("{}-{}花费时间：{}秒".format(mode, type,cost_time))
        return deco
    return wrapper

第一步，先来看看单线程的
@timer("【单线程】")
def single_thread(func, type=""):
    for i in range(10):
              func()

# 单线程
single_thread(count, type="CPU计算密集型")
single_thread(io_disk, type="磁盘IO密集型")
single_thread(io_request,type="网络IO密集型")
single_thread(io_simulation,type="模拟IO密集型")

看看结果

【单线程】-CPU计算密集型花费时间：83.42633867263794秒
【单线程】-磁盘IO密集型花费时间：15.641993284225464秒
【单线程】-网络IO密集型花费时间：1.1397218704223633秒
【单线程】-模拟IO密集型花费时间：20.020972728729248秒

第二步，再来看看多线程的

@timer("【多线程】")
def multi_thread(func, type=""):
    thread_list = []
    for i in range(10):
        t=Thread(target=func, args=())
        thread_list.append(t)
        t.start()
    e = len(thread_list)

    while True:
        for th in thread_list:
            if not th.is_alive():
                e -= 1
        if e <= 0:
            break

# 多线程
multi_thread(count, type="CPU计算密集型")
multi_thread(io_disk, type="磁盘IO密集型")
multi_thread(io_request, type="网络IO密集型")
multi_thread(io_simulation, type="模拟IO密集型")

看看结果

【多线程】-CPU计算密集型花费时间：93.82986998558044秒
【多线程】-磁盘IO密集型花费时间：13.270896911621094秒
【多线程】-网络IO密集型花费时间：0.1828296184539795秒
【多线程】-模拟IO密集型花费时间：2.0288875102996826秒

第三步，最后来看看多进程

@timer("【多进程】")
def multi_process(func, type=""):
    process_list = []
    for x in range(10):
        p = Process(target=func, args=())
        process_list.append(p)
        p.start()
    e = process_list.__len__()

    while True:
        for pr in process_list:
            if not pr.is_alive():
                e -= 1
        if e <= 0:
            break

# 多进程
multi_process(count, type="CPU计算密集型")
multi_process(io_disk, type="磁盘IO密集型")
multi_process(io_request, type="网络IO密集型")
multi_process(io_simulation, type="模拟IO密集型")

看看结果

【多进程】-CPU计算密集型花费时间：9.082211017608643秒
【多进程】-磁盘IO密集型花费时间：1.287339448928833秒
【多进程】-网络IO密集型花费时间：0.13074755668640137秒
【多进程】-模拟IO密集型花费时间：2.0076842308044434秒

3. 性能对比成果总结

将结果汇总一下，制成表格。

https://file.elecfans.com//web2/M00/36/11/poYBAGIwUWCALmJbAADPTR8eNVs753.png

我们来分析下这个表格。

首先是CPU密集型，多线程以对比单线程，不仅没有优势，显然还由于要不断的加锁释放GIL全局锁，切换线程而耗费大量时间，效率低下，而多进程，由于是多个CPU同时进行计算工作，相当于十个人做一个人的作业，显然效率是成倍增长的。

然后是IO密集型，IO密集型可以是磁盘IO，网络IO，数据库IO等，都属于同一类，计算量很小，主要是IO等待时间的浪费。通过观察，可以发现，我们磁盘IO，网络IO的数据，多线程对比单线程也没体现出很大的优势来。这是由于我们程序的的IO任务不够繁重，所以优势不够明显。

所以我还加了一个「模拟IO密集型」，用sleep来模拟IO等待时间，就是为了体现出多线程的优势，也能让大家更加直观的理解多线程的工作过程。单线程需要每个线程都要sleep(2)，10个线程就是20s，而多线程，在sleep(2)的时候，会切换到其他线程，使得10个线程同时sleep(2)，最终10个线程也就只有2s.

可以得出以下几点结论

单线程总是最慢的，多进程总是最快的。

多线程适合在IO密集场景下使用，譬如爬虫，网站开发等

多进程适合在对CPU计算运算要求较高的场景下使用，譬如大数据分析，机器学习等

多进程虽然总是最快的，但是不一定是最优的选择，因为它需要CPU资源支持下才能体现优势

审核编辑：符乾江

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

多线程

多线程

+关注

关注
0

文章
278

浏览量
19953
python

python

+关注

关注
56

文章
4797

浏览量
84674

socket 多线程编程实现方法

是指在同一个进程中运行多个线程，每个线程可以独立执行任务。线程共享进程的资源，如内存空间和文件句柄，但每个

发表于 11-12 14:16 •358次阅读

Python中多线程和多进程的区别

Python作为一种高级编程语言，提供了多种并发编程的方式，其中多线程与多进程是最常见的两种方式之一。在本文中，我们将探讨Python中多线程

发表于 10-23 11:48 •400次阅读

一文掌握Python多线程

使用线程可以把占据长时间的程序中的任务放到后台去处理。

发表于 08-05 15:46 •857次阅读

ESP32会不会有多线程问题，需要加锁吗？

ESP32会不会有多线程问题，需要加锁吗

发表于 07-19 08:05

从多线程设计模式到对 CompletableFuture 的应用

最近在开发延保服务频道页时，为了提高查询效率，使用到了多线程威廉希尔官方网站。为了对多线程方案设计有更加充分的了解，在业余时间读完了《图解 Java 多线程设计模式》这本书，觉得收获良多。本篇文章将介绍其中

发表于 06-26 14:18 •362次阅读

一句话让你理解线程和进程

今天给大家分享一下线程与进程，主要包含以下几部分内容：一句话说明线程和进程操作系统为什么需要进程为什么要引入

发表于 06-04 08:04 •1190次阅读

bootloader开多线程做引导程序，跳app初始化后直接进hardfualt，为什么？

如标题，想做一个远程升级的项目，bootloader引导区域和app都是开多线程跑的，就是自己写了个小的任务调度器，没什么功能主要是想让程序快速的响应，延时不会对其他程序造成堵塞，程序测试

发表于 04-18 06:07

鸿蒙APP开发：【ArkTS类库多线程】TaskPool和Worker的对比

TaskPool（任务池）和Worker的作用是为应用程序提供一个多线程的运行环境，用于处理耗时的计算任务或其他密集型任务。可以有效地避免这些任务阻塞主线程，从而最大化系统的利用率，降低整体资源消耗，并提高系统的整体性能。

发表于 03-26 22:09 •654次阅读

鸿蒙原生应用开发-ArkTS语言基础类库多线程TaskPool和Worker的对比（一）

TaskPool（任务池）和Worker的作用是为应用程序提供一个多线程的运行环境，用于处理耗时的计算任务或其他密集型任务。可以有效地避免这些任务阻塞主线程，从而最大化系统的利用率，降低整体资源消耗

发表于 03-25 14:11

java实现多线程的几种方式

Java实现多线程的几种方式 多线程是指程序中包含了两个或以上的线程，每个线程都可以并行执行不同的任务或操作。Java中的多线程可以提高程序

发表于 03-14 16:55 •707次阅读

python中5种线程锁盘点

线程安全是多线程或多进程编程中的一个概念，在拥有共享数据的多条线程并行执行的程序中，线程安全的代码会通过同步机制保证各个

发表于 03-07 11:08 •1593次阅读

AT socket可以多线程调用吗？

请问AT socket 可以多线程调用吗？有互锁机制吗，还是要自己做互锁。

发表于 03-01 08:22

线程是什么的基本单位进程与线程的本质区别

线程是操作系统中处理器调度的基本单位，它代表着独立的执行流。在一个进程中，可以包含多个线程，这些线程共享相同的进程资源，如内存空间、文件描述

发表于 02-02 16:30 •933次阅读

线程、进程、多线程、多进程和多任务之间有何关系？

进程是程序执行时的一个实例，即它是程序已经执行到课中程度的数据结构的汇集。从内核的观点看，进程的目的就是担当分配系统资源（CPU时间、内存等）的基本单位。

发表于 01-11 13:39 •363次阅读

mcu线程和进程的区别是什么

MCU线程和进程是嵌入式系统中常见的并行执行的概念，它们之间有许多区别，包括线程与进程的定义、资源管理、通信机制、执行方式等等。下面将详细介绍MCU

发表于 01-04 10:45 •752次阅读