利用 Python 和 Selenium 高效启动和管理 Chrome 浏览器

🕗 发布于 2024-11-20 10:19 python selenium chrome

在自动化测试和网页抓取的过程中，Selenium 是最常用的工具之一。其强大的功能可以与浏览器无缝集成，实现复杂的操作。然而，为了提高效率和扩展性，尤其在处理大量任务时，我们可以通过定制化的方法启动 Chrome 浏览器并与 Selenium 驱动连接。本文将详细解析两段关键代码，实现以下目标：

使用批处理（.bat）文件启动 Chrome 浏览器。
利用 Selenium WebDriver 动态连接已启动的浏览器实例。

优势：启动浏览器后可以随时获取driver，同样也可以随时driver.quit()进行其他操作后再获取driver。

代码实现

1. 使用批处理启动 Chrome

Chrome 提供了丰富的启动参数供开发者自定义浏览器行为。下面的函数通过生成 .bat 文件，以指定参数启动 Chrome：

def start_chrome():
    """
    通过bat的形式启动chrome浏览器
    """
    script = f"""
@echo off
start "" "{config.chrome_path}" --ignore-certificate-errors --remote-debugging-port=9528 --user-data-dir="C:\selenium\ChromeProfile" --download-default-directory="{config.tmp_dir}" --incognito --start-maximized
    """
    bat_path = pathlib.Path(config.tmp_dir, 'start_chrome.bat')
    bat_path.open('w').write(script)
    shell = wincl.Dispatch("WScript.Shell")
    shell.Run(str(bat_path), 1, True)
    time.sleep(3)

代码解析：

批处理文件的生成：
- 利用 Python 的 pathlib 模块，动态生成批处理文件 start_chrome.bat。
- 文件内容包括多个 Chrome 的启动参数：
  - --ignore-certificate-errors：忽略 SSL 证书错误，适用于测试环境。
  - --remote-debugging-port=9528：开启调试模式，指定调试端口。
  - --user-data-dir="C:\selenium\ChromeProfile"：定义浏览器用户数据目录，用于隔离会话。
  - --download-default-directory：指定文件下载路径。
  - --incognito：开启无痕模式，避免缓存和 Cookie 干扰。
  - --start-maximized：窗口启动即最大化。
执行批处理文件：
- 借助 Windows 脚本宿主（WScript.Shell）启动批处理文件，避免阻塞主线程。
- 使用 time.sleep(3) 确保浏览器完全启动。

2. 利用 Selenium WebDriver 连接已启动的 Chrome

启动浏览器后，通过以下代码，连接到已打开的 Chrome 实例进行自动化操作：

def get_driver(executable_path="chromedriver"):
    """
    获取web driver
    """
    options = webdriver.ChromeOptions()
    options.debugger_address = "127.0.0.1:9528"  # 指定调试端口
    options.add_argument('--ignore-certificate-errors')
    driver = webdriver.Chrome(options=options, executable_path=executable_path)
    driver.implicitly_wait(10)  # 设置隐式等待
    return driver

代码解析：

调试模式连接：
- 使用 options.debugger_address 配置 WebDriver，通过 127.0.0.1:9528 的调试端口连接到已经启动的 Chrome 浏览器。
忽略证书错误：
- 再次添加 --ignore-certificate-errors 参数，确保与浏览器配置一致，避免潜在冲突。
隐式等待：
- 设置 driver.implicitly_wait(10)，让 WebDriver 在查找元素时最多等待 10 秒，提升稳定性。

两者结合的优势

快速启动与复用：
- 通过批处理文件启动的 Chrome，可以在多次测试中复用，减少浏览器多次启动带来的资源消耗。
调试友好：
- 启用 --remote-debugging-port 后，开发者可以通过 Chrome DevTools 直接查看调试信息。
个性化配置：
- --user-data-dir 允许隔离用户数据，模拟不同用户的浏览行为。
- 自定义下载路径，方便批量处理文件。

使用示例

完整流程如下：

启动 Chrome：
```
start_chrome()
```

获取 WebDriver 并操作浏览器：

driver = get_driver()
driver.get("https://www.example.com")
print(driver.title)

总结

通过上述方法，我们实现了批处理文件与 Selenium WebDriver 的无缝对接。这种方式特别适用于高效处理自动化测试任务，同时支持灵活的浏览器配置。如果你在实际使用中需要进一步优化，可以根据具体需求调整启动参数，比如添加代理、禁用图片加载等。

这不仅是自动化测试中的一项技巧，也是一种提升开发效率的思路。希望这篇文章能为你的 Selenium 使用提供新的启发！

原文地址：https://blog.csdn.net/weixin_42238129/article/details/143876917

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

鸿蒙进阶篇-TextInput&TextArea和Checkbox
在鸿蒙开发中，TextInput 用于单行文本输入，TextArea 用于多行文本输入，Checkbox 则是用于多项选择的复选框组件。
阅读更多2024-11-21
MySQL45讲第二十六讲备库为什么会延迟好几个小时？——阅读总结
在MySQL数据库的主备架构中，备库延迟是一个需要重点关注的问题。它可能影响系统的可用性和数据的一致性，尤其是在主库压力较大时，备库延迟可能达到数小时甚至永远无法追上主库。今天，我们将深入探讨MySQ
阅读更多2024-11-21
快速简单的视频下载器——lux
在学习之余，发现了一个简单并且高效的视频下载器lux,能够帮你快速且高效的下载文件（不仅仅是视频可以），所以写了一篇博客分享lux的相关内容这个简单并且高效的视频下载器lux，一定会提高你的下载效率的
阅读更多2024-11-21
XGBOOST、LightGBM、CATBoost
本文介绍了三种 GBDT 的优化算法，可以根据实际情况进行选择。
阅读更多2024-11-21
【JAVA】Java基础—面向对象编程：常用API与数据结构—字符串、数组的使用
在Java编程中，字符串和数组是两个非常基础且重要的数据结构。它们在日常开发中无处不在，理解它们的使用及其背后的理论知识是成为一名合格Java开发者的必经之路。：可以将字符串比作一本书的章节。每个章节
阅读更多2024-11-21
Docker-Compose 快速部署安装 Nginx 或其他应用
测试部署的 Nginx 是否运行正常，可以在浏览器中访问 Nginx 所在的 IP 或端口，确保能够看到默认的 Nginx 页面。（如果你安装的是 Docker CE）。将下载的 Docker-Com
阅读更多2024-11-21
微信小程序申请getlocation权限
2、如果小程序没有导航功能。可以使用wx.openLocation写一个导航页面功能，以便进行权限申请。所以需要申请getlocation权限的开启。体验版没有申请开启不影响使用，但是上线提审必须申请
阅读更多2024-11-21
(RK3566驱动开发 - 2）.IIC驱动
【代码】(RK3566驱动开发 - 2）.IIC驱动。
阅读更多2024-11-21
04 搭建linux驱动开发环境
虽然 petalinux 功能很全面，但是其编译速度较慢，不适用于驱动调试阶段（因为驱动调试阶段会频繁修改驱动模块、内核、设备树等），因此本章将采用分步编译的方式来编译启动开发板所需要的各种镜像文件，
阅读更多2024-11-21
2025蓝桥杯（单片机）备赛--扩展外设之NE555的使用及定时器1的详细讲解（十）
超详细的定时器555讲解
阅读更多2024-11-21