Selenium自动填写验证码（偏小白版本OCR）

🕗 发布于 2024-04-13 08:08 ocr

OCR基础示例

我直接

上代码

from PIL import Image
import pytesseract

# 0 Orientation and script detection (OSD) only.
# 1 Automatic page segmentation with OSD.
# 2 Automatic page segmentation, but no OSD, or OCR.
# 3 Fully automatic page segmentation, but no OSD. (Default)
# 4 Assume a single column of text of variable sizes.
# 5 Assume a single uniform block of vertically aligned text.
# 6 Assume a single uniform block of text.
# 7 Treat the image as a single text line.
# 8 Treat the image as a single word.
# 9 Treat the image as a single word in a circle.
# 10 Treat the image as a single character.
# 11 Sparse text. Find as much text as possible in no particular order.
# 12 Sparse text with OSD.
# 13 Raw line. Treat the image as a single text line, bypassing hacks that are Tesseract-specific.


def get_chaptcha(psm):
    pytesseract.pytesseract.tesseract_cmd = r'D:\Tesseract-OCR\tesseract.exe'
    # 打开图像并转换为灰度图像
    image = Image.open('captcha.png').convert('L')
    # image = Image.open('captcha.png')
    # 使用 OCR 识别验证码
    captcha_text = pytesseract.image_to_string(image, config=f'--psm {psm}')
    print(captcha_text)
    return captcha_text


if __name__ == '__main__':
    get_chaptcha(1)

主要难点就是安装Tesseract-OCR了，去GItHub上搜一搜，去搜索引擎上搜一搜就能下载到了

然后就是使用tesseract_cmd 指定你的tesseract.exe的位置

Tesseract就是一个别人开发好的用来识别验证码的工具，下载好之后是为了给Python调用的

而pytesseract这个库就是为了调用Tesseract-OCR的

注意：OCR一共有13个模式，一般用索引为1的模式会比较通用，特别是像我这种小白，索引1的模式准没错

Selenium基础实战示例

time.sleep(1)
captcha_png_tag = chrome.find_xpath('//*[@id="captchaImg"]')
# captcha_url = captcha_png_tag.get_attribute('src')
captcha_png_tag.screenshot('captcha.png')
time.sleep(1)
captcha_text = simple_ocr.get_chaptcha(1)
time.sleep(1)
print(captcha_text)
if captcha_text == "":
    login()

captcha_input_tag = chrome.find_xpath('//*[@id="captcha"]')
chrome.input_message_tag(captcha_text, captcha_input_tag)
  
time.sleep(2)
# 检查是否出现了验证码错误弹窗
if check_captcha_error(chrome.driver):
    close_all_alert(chrome.driver)
    chrome.driver.refresh()
    time.sleep(2)  # 等待2秒以确保页面已经加载
    login()

有的网站的验证码是动态验证码，不能用下载原图的方式获取验证码的图片

只能通过Selenium自带的截图功能截图保存，这个截图功能还是挺好用的，可以支持仅截图某个页面元素

注意：有时候OCR无法识别验证码，会返回空结果，这个时候就得刷新验证码或者刷新网页再次尝试登录了

原文地址：https://blog.csdn.net/weixin_47420447/article/details/137697754

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：ubuntu/debian 编译 php7.4
下一篇：【MVCC】深入浅出彻底理解MVCC

激发AI创造力：掌握Prompt提示词的高效提问方法
提示词工程一句话的解释组织有规律的关键词，抽取有用的信息。提示词是如何影响AI的输出结果?从以上可以看出，对AI输入不同的提示词，会显著影响AI回答问题的角度和专业度。精心设计的提示词能够引导AI更准
阅读更多2024-09-20
【LabVIEW】事件结构的用法
【LabVIEW】事件结构的用法
阅读更多2024-09-20
开源ERP系统odoo的安装与配置
Odoo是全球流行的开源企业管理套件,其功能涵盖了CRM、营销、销售、采购、库存管理(WMS)、生产制造、财务核算、项目管理、质量管理、PLM、人力资源等一系列完善的企业信息化工具。
阅读更多2024-09-20
大数据Flink（一百二十一）：Flink CDC基本介绍
Flink CDC 基于数据库日志的 Change Data Caputre 技术，实现了全量和增量的一体化读取能力，并借助 Flink 优秀的管道能力和丰富的上下游生态，支持捕获多种数据库的变更，并
阅读更多2024-09-20
【PGCCC】使用 Postgres 进行数据分析的窗口函数
Window 函数的部分OVER是创建窗口。令人讨厌的是，window 这个词在任何函数中都没有出现。通常，OVER 部分由另一个函数（聚合函数或数学函数）开头。通常还有一个框架，用于指定您正在查看的
阅读更多2024-09-20
SpinalHDL之结构（三）
⼀、简介(Introduction)⽤Scala函数产⽣硬件的⽅式与VHDL/Verilog中非常不同, 原因如下：
阅读更多2024-09-20
【SpinalHDL】Scala/SpinalHDL联合编程之实例化
在构造阶段，使用 Scala 数据类型来参数化硬件设计。硬件信号（如 Bool）只能在硬件描述内部使用，表示硬件运行时的信号，不应用于控制硬件的生成。避免在 Scala 控制流中使用硬件信号，以防止产
阅读更多2024-09-20
flink kafka sink （scala）
将对象数据通过Gson 转为jsonString，在将数据写到kafka中，这个可以根据需要修改，比如按照\t分开也行，可以节省字段名称的空间。那么如果需要减少Gson的创建，可以自定义map函数，继
阅读更多2024-09-20
linux之scp命令文件传输
在开发时经常会遇到两台机器之间传文件或者安装包，这就用到了scp命令。
阅读更多2024-09-20
【SpinalHDL】Scala编程之伴生对象
Scala中的伴生对象是指和在同一个文件中声明的，并且和类同名的对象。)，这意味着这个类中的方法可以工作，因为它可以访问它的伴生对象中的字段: printFilename HiddenFilename
阅读更多2024-09-20

Selenium自动填写验证码（偏小白版本OCR）

OCR基础示例

Selenium基础实战示例

相关文章