python获取滑块验证码需要滑动的距离

🕗 发布于 2024-09-20 17:49 python 爬虫逆向滑块验证码

我们以这个网站为例: http://120.86.191.138/hbgs/zwgk/dirData.do?dirId=402881204e959150014e959f42f30014&subjectId=93e889f2501d3fe8015024305bdf0efc
往后点到第四页后会出现验证码

一.获取到背景图片和缺口图片

在这里插入图片描述
我们发现图片是base64格式通过API直接发送

二.识别缺口位置输出x距离

img_data = base64.b64decode(img_data)  # png
img_btn_data = base64.b64decode(img_btn_data)  # png
# 读取图片
img = Image.open(io.BytesIO(img_data))
img_btn = Image.open(io.BytesIO(img_btn_data))
# 识别缺口
left = identify_gap(img, img_btn, bg_params, gp_params)[0]
print(left)

identify_gap.py

import cv2
import numpy as np


def identify_gap(background, gap, bg_edge_list: list[int], gp_edge_list: list[int]):
    """
    获取缺口的X坐标

    使用OpenCV的边缘检测实现

    :param background: 背景图片对象
    :param gap: 缺口图片对象
        图片对象可以是cv2.imread('opencv_logo.jpg',0)
        也可以是PIL.Image.open('opencv_logo.jpg')
    :param bg_edge_list: 背景图片对比度调整参数[50, 100] 50为最小对比度，100为最大对比度
    :param gp_edge_list:缺口图片对比度调整参数[50, 100] 50为最小对比度，100为最大对比度
    :return:
    """

    background_image = background  # 背景图片
    background_image = np.array(background_image)
    gap_image = gap  # 缺口图片
    gap_image = np.array(gap_image)
    # 识别图片边缘
    background_edge = cv2.Canny(background_image, bg_edge_list[0], bg_edge_list[1])
    gap_edge = cv2.Canny(gap_image, gp_edge_list[0], gp_edge_list[1])

    # 转换图片格式
    background_picture = cv2.cvtColor(background_edge, cv2.COLOR_GRAY2RGB)

    gap_picture = cv2.cvtColor(gap_edge, cv2.COLOR_GRAY2RGB)

    res = cv2.matchTemplate(background_picture, gap_picture, cv2.TM_CCOEFF_NORMED)
    min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res)  # type: ignore

    return max_loc

3.完整代码

import base64
import io
import re
import requests
from PIL import Image
from packages.scrapy_spiders.utils.captcha.compare_image import identify_gap
def getlist_cookie(yzm_res):
    """
    获取验证码返回的set-cookie并返回
    :param response:
    :return dic:
    """
    extracted_cookies = {}
    cookies = yzm_res.headers["Set-Cookie"].split(",")
    # 解析Set-Cookie头部中的cookies
    for cookie in cookies:
        parts = cookie.split(";")[0].split("=")
        if len(parts) == 2:
            key, value = parts
            extracted_cookies[key.strip()] = value.strip()
    return extracted_cookies
def generate_random_string():
    htmlurl='http://120.86.191.138/hbgs/verify/index.do'
    response = requests.get(htmlurl).text
    # 编写正则表达式来匹配verify后的值，注意这里我们使用了转义字符来匹配冒号和单引号
    pattern = r"verify\s*:\s*'([^']*)'"

    # 使用re.search查找匹配项
    match = re.search(pattern, response)

    # 如果找到匹配项，则提取括号内的内容（即需要的值）
    if match:
        value = match.group(1)
        print("提取的verify值为:", value)
    else:
        print("未找到匹配的verify值")
        return None

    return value

ssst=generate_random_string()

yzm_url=f'http://120.86.191.138/hbgs/verify/get_img_verify.do?verify={ssst}'
res=requests.get(yzm_url)
cookies = getlist_cookie(res)
res=res.json()
bg_params = [100, 200]
gp_params = [100, 200]
img_data=res["oriCopyImage"]
img_btn_data=res["newImage"]
img_data = base64.b64decode(img_data)  # jpg
img_btn_data = base64.b64decode(img_btn_data)  # png
# 读取图片
img = Image.open(io.BytesIO(img_data))
img_btn = Image.open(io.BytesIO(img_btn_data))
# 识别缺口
left = identify_gap(img, img_btn, bg_params, gp_params)[0]
print(left)

dataurl='http://120.86.191.138/hbgs/verify/check.do'
header={
'Content-Type': 'application/x-www-form-urlencoded; charset=UTF-8'
}
formdata=f'verify={ssst}&IY={res["Y"]}&X={left}&Y={res["Y"]}'

res2=requests.post(dataurl, formdata,cookies=cookies,headers=header).json()
print(res2)
itemurl='http://120.86.191.138/hbgs/zwgk/item.do'
formdata=f'page=6&rows=20&HBTB_XH=&HBTB_XH_END=&HBTB_XMMC=&HBTB_SPWH=&HBTB_TXDZ=&HBTB_GSSJ=&HBTB_GSSJ_END=&dirId=402881204e959150014e95bb85b5010f&subjectId=93e889f2501d3fe8015024305bdf0efc&backPage=&vcode={res2["data"]}'

res=requests.post(itemurl, formdata)
print(res.text)

原文地址：https://blog.csdn.net/qq_62975494/article/details/142387150

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：c++初阶--c++类和对象(下)
下一篇：信息化时代下的高标准农田灌区：变革与机遇并存

ai写作软件排行榜前十名，5个软件帮助你快速使用ai写作
无论是需要撰写一篇深度分析的行业报告、一篇引人入胜的故事小说、一封专业得体的商务邮件，还是一段吸引眼球的社交媒体文案，这款AI写作工具都能轻松应对，让创作过程变得更加高效与便捷。随着用户的使用与反馈，
阅读更多2024-09-20
react 甘特图之旅
dhtmlx-gantt
阅读更多2024-09-20
[Spring]Spring MVC 请求和响应及用到的注解
Spring Web MVC 是基于 Servlet API 构建的原始 Web 框架，从⼀开始就包含在 Spring 框架中。MVC 是 Model View Controller 的缩写，它是软件
阅读更多2024-09-20
MATLAB基础：1.矩阵
矩阵是大部分运算或命令都是针对矩阵的不需要对矩阵的维数、大小和类型进行说明会根据用户所输入的内容自动进行配置矩阵：由m*n个数排列而成，简称 m*n矩阵字符串也视为矩阵，元素是字符。
阅读更多2024-09-20
中石化法律服务AI大平台 | OPENAIGC开发者大赛企业组AI创新之星奖
中石化法律服务AI大平台是基于企业相关信息系统操作及法律咨询需求打造的一套自动化产品，通过AIGC技术 ( OCR+NLP+ChatGPT ) 的结合，在法律咨询、合同审查、制度审查等阶段协助经办人制
阅读更多2024-09-20
单身狗的逆袭之路之开发相亲交友系统
相亲交友系统为单身人士提供逆袭机会，通过智能匹配算法提高成功率，满足个性化需求。
阅读更多2024-09-20
js-利用创建a便签实现下载文件功能
vue2 利用a标签实现文件下载功能
阅读更多2024-09-20
删除视频最后几帧剪切视频
删除视频最后帧剪切视频
阅读更多2024-09-20
JVM字节码与局部变量表
x：可以是i(int、byte、char、short、boolean类型)、l(long类型)、f(float类型)、d(double类型)、a(引用类型)x：可以是i(int、byte、char、s
阅读更多2024-09-20
基于深度学习的文本引导的图像编辑
基于深度学习的文本引导图像编辑技术结合了图像生成和自然语言处理的最新进展，通过生成对抗网络、变换器和扩散模型等方法，使用户能够通过文本描述实现对图像内容的灵活编辑。这一技术在多个应用场景中展现了巨大的
阅读更多2024-09-20

python获取滑块验证码需要滑动的距离

一.获取到背景图片和缺口图片

二.识别缺口位置输出x距离

3.完整代码

相关文章