自学内容网 自学内容网

[自动化]获取每次翻页后的页面 URL

from DrissionPage import ChromiumPage page = ChromiumPage() page.get('热门项目 - Gitee.com') page.listen.start('gitee.com/explore') for i in range(5): page("@rel=next").click() res= page.listen.wait() print(res.url)

这段代码使用了DrissionPage库中的ChromiumPage类来实现对网页的自动化操作。以下是对代码的解释:

  1. from DrissionPage import ChromiumPage:从DrissionPage库中导入ChromiumPage类,用于创建一个基于 Chromium 浏览器的页面操作对象。
  2. page = ChromiumPage():创建一个ChromiumPage对象,用于后续的页面操作。
  3. page.get('https://gitee.com/explore/all'):使用get方法打开指定的网页。
  4. page.listen.start('gitee.com/explore'):启动页面监听,监听与gitee.com/explore相关的事件。
  5. for i in range(5)::循环 5 次。
    • page("@rel=next").click():找到页面中rel属性为next的元素并点击,通常用于翻页操作。
    • res = page.listen.wait():等待监听事件触发,并获取相关的响应结果。
    • print(res.url):打印响应结果中的 URL。

这段代码的目的是模拟用户在网页上进行翻页操作,并获取每次翻页后的页面 URL。通过监听事件,可以获取页面加载完成后的相关信息。

请注意,在实际运行代码之前,需要确保已经安装了DrissionPage库及其相关依赖。此外,网页的结构和元素可能会发生变化,代码中的选择器@rel=next可能需要根据实际情况进行调整。


原文地址:https://blog.csdn.net/lfsysc/article/details/144014084

免责声明:本站文章内容转载自网络资源,如侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!