说说page.on('response'，fn)

提炼

本文聚焦 Puppeteer 中 page.waitForResponse 和 page.on('response', fn) 的对比，二者虽都用于监听网络请求响应，执行环境均为 Node.js 且底层基于对 Network.responseReceived 事件监听，但在特性、适用场景和实现机制上差异显著。文中着重剖析了 page.on('response', fn) 的底层原理，从 Puppeteer 启动浏览器创建与 Chromium 的 WebSocket 通信通道，到设置监听时发送 Network.enable 消息（按需发送以避免不必要调用），再到 Chromium 发送 Network.responseReceived 事件，Puppeteer 封装 HttpResponse 对象并触发回调函数的全过程。同时说明了响应体出于性能考虑未在该事件中直接传递，而是在特定方法调用时才获取并填充到 Response 对象。

本文于 2025-09-20 22:53 首次发布，最后修改于 2025-09-21 21:48

说说 page.on('response'，fn)

与 page.waitForResponse 类似，page.on('response', fn) 同样可以用于监听和等待网络请求的响应，两者的执行环境均为 Node.js，且底层都基于对 Network.responseReceived 事件的监听。然而，它们在特性、适用场景和实现机制上都存在着显著差异。

page.waitForResponse与page.on('response',fn)的对比

底层原理剖析

从设置 page.on('response', fn) 进行监听到捕获想要的 response，实际上会经历以下流程：

Puppeteer 在 launch 浏览器时即创建了与 Chromium 之间的 WebSocket 通信通道；
当 Node.js 层设置 page.on('response', fn) 方法时，即从 Puppeteer 通过 WebSocket 向 Chromium 发送一条 Network.enable 消息以启用网络监控，并在 Puppeteer 层的内部事件发射器（Event Emitter）上为 response 事件注册了一个监听器（也就是将你的回调函数存起来，等待后续触发）；
1. Network.enable 是 CDP (Chrome DevTools Protocol) 中的一个命令，它的主要作用是：
2. 1. 启用网络域监控：告诉 Chromium 开始收集和发送网络相关的所有事件；
  2. 开启网络流量追踪：激活浏览器内部的网络监控功能；
3. 实际上，为了避免不必要的 CDP 命令调用，并不是每次设置 page.on('response', fn) 时都会发送 Network.enable 消息，而是先由 Puppeteer 确认是否已经开启网络监控，只有在确认未开启时，才会发送消息，否则就不发送了；
当 Chromium 内核接收到原始的网络数据（包含 HTTP 状态码、头部、响应体后）后，通过 WebSocket 向 Puppeteer 发送“携带了原始的网络数据（不包含响应体）的 Network.responseReceived CDP 事件”；
由 Puppeteer 接收到网络的原始数据后封装成一个统一的、易于使用的 HttpResponse 对象，这个对象包含了像 status()、url()、ok() 等方便开发者使用的方法；
最后，再由 Puppeteer 将这个对象作为参数，触发第二步中注册好的回调函数：page.emit('response', fn)；

关于响应体未在 Network.responseReceived CDP 事件中传递的说明

首先，这是为了性能考虑。如果每个响应都直接传输完整的响应体（特别是对于大文件），会占用大量的内存和带宽。因此，Chromium 默认只发送轻量级的元数据；

其次，Puppeteer 接收到 Network.responseReceived 事件后，会封装一个 Response 对象。此时，这个对象里还没有响应体数据。只有当你在 回调函数或 Node.js 层 显式调用了 response.buffer()（或 response.json()、response.text()）方法时，Puppeteer 才会：

1. 向浏览器发送一个 Network.getResponseBody 的 CDP 命令；

2. 浏览器接收到命令后，将完整的响应体数据通过 WebSocket 发送给 Puppeteer；

3. Puppeteer 将接收到的数据填充到 Response 对象中，并返回给 Node.js 层或者回调函数。

0个赞

喜欢就点个赞吧

相关推荐

Chrome Extension 和 Puppeteer 如何获取 closed 状态的 Shadow Root

2025-10-10 12:55

page.waitForResponse 和 page.on('response', fn) 的资源开销对比

2025-10-02 22:31

page.on('response',fn) 的最佳实践之等待响应

2025-09-28 09:39

page.on('response',fn) 的竞态条件

2025-09-24 23:00

page.on('response',fn) 适用于“对响应顺序不敏感”的场景

2025-09-22 07:39

说说page.on('response'，fn)

2025-09-20 22:53

说说 Jest 的 --bail 参数与场景应用

2025-09-17 22:17

page.once('response',fn) 的竞态条件

2025-09-16 06:28

为什么 page.waitForResponse 只适合“短时间内返回响应”的场景？

2025-09-12 23:19

page.waitForResponse 的竞态条件与最佳实践

2025-09-11 22:28

文章大纲

说说 page.on('response'，fn)

底层原理剖析

关于响应体未在 Network.responseReceived CDP 事件中传递的说明

说说 page.on('response'，fn)

page.waitForResponse与page.on('response',fn)的对比

底层原理剖析

从设置 page.on('response', fn) 进行监听到捕获想要的 response，实际上会经历以下流程：

Puppeteer 在 launch 浏览器时即创建了与 Chromium 之间的 WebSocket 通信通道；

当 Node.js 层设置 page.on('response', fn) 方法时，即从 Puppeteer 通过 WebSocket 向 Chromium 发送一条 Network.enable 消息以启用网络监控，并在 Puppeteer 层的内部事件发射器（Event Emitter）上为 response 事件注册了一个监听器（也就是将你的回调函数存起来，等待后续触发）；

Network.enable 是 CDP (Chrome DevTools Protocol) 中的一个命令，它的主要作用是：
1. 启用网络域监控：告诉 Chromium 开始收集和发送网络相关的所有事件；
2. 开启网络流量追踪：激活浏览器内部的网络监控功能；
实际上，为了避免不必要的 CDP 命令调用，并不是每次设置 page.on('response', fn) 时都会发送 Network.enable 消息，而是先由 Puppeteer 确认是否已经开启网络监控，只有在确认未开启时，才会发送消息，否则就不发送了；

当 Chromium 内核接收到原始的网络数据（包含 HTTP 状态码、头部、响应体后）后，通过 WebSocket 向 Puppeteer 发送“携带了原始的网络数据（不包含响应体）的 Network.responseReceived CDP 事件”；

由 Puppeteer 接收到网络的原始数据后封装成一个统一的、易于使用的 HttpResponse 对象，这个对象包含了像 status()、url()、ok() 等方便开发者使用的方法；

最后，再由 Puppeteer 将这个对象作为参数，触发第二步中注册好的回调函数：page.emit('response', fn)；

关于响应体未在 Network.responseReceived CDP 事件中传递的说明

1. 向浏览器发送一个 Network.getResponseBody 的 CDP 命令；

2. 浏览器接收到命令后，将完整的响应体数据通过 WebSocket 发送给 Puppeteer；

3. Puppeteer 将接收到的数据填充到 Response 对象中，并返回给 Node.js 层或者回调函数。