如何解决selenium无头浏览器访问页面失败问题！！

🕗 发布于 2024-04-18 19:26 selenium 测试工具

无头浏览器简介

无头浏览器（Headless browser）是一种没有图形用户界面（GUI）的网络浏览器。它可以在后台运行，并通过编程接口进行控制和操作，而不需要显示界面。通常，传统的浏览器如 Chrome、Firefox 和 Safari 都具有图形用户界面，但这些浏览器也提供了无头模式的选项。无头浏览器的主要用途是自动化测试和网页爬取。通过使用编程语言（如JavaScript，Python，Java等）的驱动程序或库，开发者可以模拟用户交互，并执行各种操作，如加载页面、点击按钮、填写表单等。由于无头浏览器在后台运行，因此可以在服务器上高效地进行自动化测试和数据抓取，而无需实际显示浏览器窗口。

无头浏览器优点

没有图形用户界面，可以节省资源和内存消耗。提供编程接口，可以通过代码进行控制和操作。支持模拟用户行为，如点击、输入、提交表单等。可以访问网页的 DOM 结构和网络请求，并进行相应的处理和分析。

无头浏览器代码设置

from selenium.webdriver.chrome.options import Options
      options = Options()
      options.add_argument('--headless')

完整无头浏览器代码设置

由于谷歌浏览器会自动更新，每次运行脚本会判断chromedeiver是否和chrome浏览器版本匹配。所以需要设置自动下载最新chromedriver驱动的脚本。

from selenium.webdriver.chrome.service import Service as ChromeService
# WebDriver-Manager自动更新驱动程序的版本
from webdriver_manager.chrome import ChromeDriverManager
from selenium.webdriver.chrome.options import Options
       service = ChromeService(ChromeDriverManager().install(), 30)
        # 设置无头浏览器,解决无头浏览器定位元素失败
        options = Options()
        self.driver = webdriver.Chrome(options=options, service=service)

运行当前脚本
在这里插入图片描述
当前截图错误是由于selenium通过无头浏览器操作页面，受到了反向爬虫限制，导致页面访问被禁止。导致定位元素失败。

解决方案-附上完整代码

service = ChromeService(ChromeDriverManager().install(), 30)
        # 设置无头浏览器,解决无头浏览器定位元素失败
        options = Options()
        options.add_argument("--window-size=1920,1080")
        options.add_argument("--disable-extensions")
        options.add_argument("--proxy-server='direct://'")
        options.add_argument("--proxy-bypass-list=*")
        options.add_argument("--start-maximized")
        options.add_argument('--headless')
        options.add_argument('--disable-gpu')
        options.add_argument('--disable-dev-shm-usage')
        options.add_argument('--no-sandbox')
        options.add_argument('--ignore-certificate-errors')
        self.driver = webdriver.Chrome(options=options, service=service)

原文地址：https://blog.csdn.net/dadati/article/details/137674418

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Selenium - java - 屏幕截图
下一篇：【论文阅读】TransGNN

Linux网络工具：用于查询DNS（域名系统）域名解析信息的命令nslookup详解
Linux中的nslookup工具是一个功能强大的网络命令行工具，主要用于查询DNS（域名系统）域名解析信息，可以进行正向解析和反向解析。它可以帮助用户诊断网络连接问题、检查域名解析是否正确，以及查询
阅读更多2024-09-22
Windows下批量重命名文件【bat实现】-两个小问题
在txt文件后边加一行“PAUSE”之后再生成.bat，发现是因为文件名中文乱码，导致找不到文件。这是因为我在文件夹用右键打开的——“在终端运行”，正确的方式是在搜索栏输入cmd打开命令行。解决方式：
阅读更多2024-09-22
图结构感知的Transformer：一种新的图表示学习方法
尽管图神经网络（GNNs）在处理图数据方面取得了显著成就，但它们在表达能力和捕获长距离依赖方面存在局限性。为了突破这些局限，研究者们开始探索将Transformer架构应用于图表示学习。在此基础上，瑞
阅读更多2024-09-22
C#学习笔记（三）Visual Studio安装与使用
本文主要介绍了Visual Studio的安装和使用，介绍了几个简单的Winfom程序
阅读更多2024-09-22
MySQL面试题——第一篇
表类型如果是MyISAM，那么id就是8如果是InnoDB，那就是6InnoDB表只会把自增主键的最大id记录在内存中，所以重启之后才会导致最大id丢失。每当行被更改时，时间戳字段将获取当前时间戳。内
阅读更多2024-09-22
Pandas的入门操作-DataFrame对象
求是否高于平均年龄。
阅读更多2024-09-22
基于YOLOv5的教室人数检测统计系统
基于YOLOv5的教室人数检测统计系统。自动考勤、安全监控或空间利用分析
阅读更多2024-09-22
双虚拟机部署php项目
经过前面的学习，我们对分布式部署有了一定的了解，这次我们尝试做些东西。
阅读更多2024-09-22
位图与布隆过滤器
思路1：排序+二分查找思路2：哈希或红黑树因为40亿个整数要占用16GB102410241024Byte 约等于10亿Byte=1GB40亿*4Byte = 16GB16G太大放不进内存，就算我们用归
阅读更多2024-09-22
开始场景的制作+气泡特效的添加
4.将Main Camera拖拽到Render Camera中（用于指定相机）。1.在Project面板中创建Scenes文件夹，用于存放游戏场景。3.如图，在层级面板执行操作1后，选择Canvas，
阅读更多2024-09-22