深入理解Python中的生成器与协程：从基础到实战

03-03 14阅读

在现代编程中，高效地处理数据流和优化资源使用是至关重要的。Python 提供了多种工具来实现这些目标，其中生成器（Generators）和协程（Coroutines）是非常强大且灵活的特性。它们不仅可以帮助我们编写更简洁、更高效的代码，还可以解决一些复杂的并发问题。本文将深入探讨 Python 中的生成器与协程，通过实际代码示例展示它们的工作原理和应用场景。

生成器（Generators）

基本概念

生成器是一种特殊的迭代器，它允许我们在需要时逐步生成值，而不是一次性创建整个序列。这使得生成器非常适合处理大数据集或无限序列，因为它不会占用过多的内存。

生成器可以通过两种方式创建：

生成器函数：使用 yield 关键字定义。生成器表达式：类似于列表推导式，但使用圆括号 () 而不是方括号 []。

示例：生成斐波那契数列

def fibonacci(n):    a, b = 0, 1    for _ in range(n):        yield a        a, b = b, a + b# 使用生成器fib = fibonacci(10)for num in fib:    print(num, end=' ')

输出结果：

0 1 1 2 3 5 8 13 21 34

在这个例子中，fibonacci 函数是一个生成器函数，它每次调用 yield 时返回一个值，并暂停执行。当再次调用时，它会从上次暂停的地方继续执行，直到遍历完所有元素。

生成器的优点

节省内存：生成器只在需要时生成值，因此可以处理非常大的数据集而不会导致内存溢出。惰性求值：生成器是惰性的，只有在需要时才会计算下一个值，这提高了性能。可读性强：生成器通常比传统的迭代器更容易理解和维护。

协程（Coroutines）

基本概念

协程是一种可以暂停和恢复执行的函数，它允许我们在函数内部保存状态并在不同时间点之间切换。协程通常用于异步编程和并发任务的管理。

在 Python 3.5 及以上版本中，协程可以通过 async 和 await 关键字定义。协程本质上是基于生成器的扩展，但它提供了更强大的功能，如并发执行和异步 I/O 操作。

示例：简单的协程

import asyncioasync def greet(name, delay):    await asyncio.sleep(delay)    print(f"Hello, {name}!")async def main():    task1 = asyncio.create_task(greet("Alice", 2))    task2 = asyncio.create_task(greet("Bob", 1))    await task1    await task2# 运行协程asyncio.run(main())

输出结果（可能顺序不同）：

Hello, Bob!Hello, Alice!

在这个例子中，greet 是一个协程函数，它使用 await 关键字暂停执行并等待指定的时间。main 函数创建了两个任务并等待它们完成。由于 asyncio.sleep 是非阻塞的，两个任务可以并发执行，从而提高了效率。

协程的优点

并发执行：协程可以在同一事件循环中并发执行多个任务，而不需要多线程或多进程的支持。简化异步编程：协程提供了一种更直观的方式来编写异步代码，避免了回调地狱（Callback Hell）。高效资源利用：协程通过事件驱动的方式减少了上下文切换的开销，提升了系统的整体性能。

实战应用：构建一个异步爬虫

为了更好地理解生成器和协程的实际应用，我们将构建一个简单的异步网页爬虫。这个爬虫将使用 aiohttp 库进行 HTTP 请求，并通过协程并发抓取多个网页。

安装依赖

首先，确保安装了 aiohttp 库：

pip install aiohttp

爬虫代码

import asyncioimport aiohttpfrom bs4 import BeautifulSoupasync def fetch_page(session, url):    async with session.get(url) as response:        return await response.text()async def parse_page(html):    soup = BeautifulSoup(html, 'html.parser')    title = soup.title.string if soup.title else "No Title"    return titleasync def crawl(urls):    async with aiohttp.ClientSession() as session:        tasks = [fetch_page(session, url) for url in urls]        htmls = await asyncio.gather(*tasks)        titles = [await parse_page(html) for html in htmls]        return titlesif __name__ == "__main__":    urls = [        "https://www.python.org",        "https://www.github.com",        "https://www.wikipedia.org",        "https://www.stackoverflow.com"    ]    titles = asyncio.run(crawl(urls))    for url, title in zip(urls, titles):        print(f"{url}: {title}")

解释

fetch_page：这是一个协程函数，负责发送 HTTP 请求并获取网页内容。parse_page：这是一个协程函数，使用 BeautifulSoup 解析 HTML 并提取标题。crawl：这是主协程函数，它创建了一个 ClientSession 并并发抓取多个网页。使用 asyncio.gather 来并发执行多个 fetch_page 任务。asyncio.run：启动事件循环并运行 crawl 协程。

输出结果

https://www.python.org: Welcome to Python.orghttps://www.github.com: The world's leading software development platform · GitHubhttps://www.wikipedia.org: Wikipediahttps://www.stackoverflow.com: Stack Overflow - Where Developers Learn, Share, &amp; Build Careers

总结

通过本文的介绍，我们深入了解了 Python 中的生成器和协程，并通过实际代码展示了它们的强大功能。生成器适合处理大数据集和惰性求值场景，而协程则为异步编程和并发任务提供了优雅的解决方案。结合两者，我们可以编写出高效、简洁且易于维护的代码，特别是在处理网络请求、文件操作等 I/O 密集型任务时表现尤为出色。

希望本文能帮助你更好地理解和应用这些高级特性，提升你的编程技能。

免责声明：本文来自网站作者，不代表ixcun的观点和立场，本站所发布的一切资源仅限用于学习和研究目的；不得将上述内容用于商业或者非法用途，否则，一切后果请用户自负。本站信息来自网络，版权争议与本站无关。您必须在下载后的24个小时之内，从您的电脑中彻底删除上述内容。如果您喜欢该程序，请支持正版软件，购买注册，得到更好的正版服务。客服邮箱：aviv@vne.cc

深入理解Python中的生成器与协程：从基础到实战

生成器（Generators）

基本概念

示例：生成斐波那契数列

生成器的优点

协程（Coroutines）

基本概念

示例：简单的协程

协程的优点

实战应用：构建一个异步爬虫

安装依赖

爬虫代码

解释

输出结果

总结

相关阅读

深入理解Python中的装饰器：从基础到高级应用

深入解析Python中的生成器与协程

使用Python实现基于KNN算法的鸢尾花分类

深入理解Python中的装饰器：从基础到高级应用

微信号复制成功