Python实现图片定位与自动输入文字
简介
本文介绍如何使用Python实现在屏幕上定位特定图片,并在目标位置自动输入文字的功能。主要使用OpenCV进行图像识别,PyAutoGUI实现鼠标控制和键盘输入。
主要功能
- 在屏幕上查找指定图片位置
- 自动移动鼠标到目标位置
- 模拟鼠标点击
- 自动输入中文文字
技术要点
1. 图片定位
使用OpenCV的模板匹配功能,通过cv2.matchTemplate()
函数在屏幕截图中查找目标图片。匹配度阈值设为0.7,可根据实际需求调整。
2. 屏幕操作
- 使用
ImageGrab
获取屏幕截图 - 使用
pyautogui
控制鼠标移动和点击 - 设置
FAILSAFE = True
启用PyAutoGUI的安全机制
3. 中文输入
通过剪贴板实现中文输入:
- 将文字复制到剪贴板
- 使用Ctrl+V模拟粘贴操作
使用说明
环境准备
pip install opencv-python
pip install pyautogui
pip install pillow
pip install numpy
pip install pyperclip
使用步骤
- 准备要查找的目标图片(test.png)
- 运行程序
- 程序会自动查找图片位置并执行点击和输入操作
注意事项
- 确保目标图片清晰可见
- 图片匹配阈值可根据需要调整
- 建议在执行自动操作前关闭输入法
完整代码
import cv2
import numpy as np
import pyautogui
import time
from PIL import ImageGrab
import pyperclip
def type_chinese_text(text):
"""使用剪贴板输入中文"""
pyperclip.copy(text) # 复制到剪贴板
pyautogui.hotkey('ctrl', 'v') # 粘贴
def find_image_on_screen(template_path, threshold=0.7):
"""在屏幕上查找指定图片的位置"""
try:
# 读取模板图片
template = cv2.imread(template_path)
template_height, template_width = template.shape[:2]
# 截取整个屏幕
screen = np.array(ImageGrab.grab())
screen = cv2.cvtColor(screen, cv2.COLOR_RGB2BGR)
# 模板匹配
result = cv2.matchTemplate(screen, template, cv2.TM_CCOEFF_NORMED)
locations = np.where(result >= threshold)
matches = []
for pt in zip(*locations[::-1]):
matches.append({
'left': pt[0],
'top': pt[1],
'width': template_width,
'height': template_height,
'confidence': result[pt[1], pt[0]]
})
matches.sort(key=lambda x: x['confidence'], reverse=True)
return matches
except Exception as e:
print(f"查找图片时发生错误: {e}")
return []
def interact_with_image(matches, text_to_type="你好"):
"""移动到图片位置并输入文字"""
if not matches:
print("未找到目标图片")
return False
# 使用最佳匹配
best_match = matches[0]
# 计算图片中心位置
center_x = best_match['left'] + best_match['width'] // 2
center_y = best_match['top'] + best_match['height'] // 2
try:
# 移动鼠标
print(f"正在移动鼠标到位置: ({center_x}, {center_y})")
pyautogui.moveTo(center_x, center_y, duration=0.5)
# 点击位置
print("点击位置")
pyautogui.click()
# 等待一小段时间确保点击生效
time.sleep(0.5)
# 输入中文
print(f"正在输入文字: {text_to_type}")
type_chinese_text(text_to_type)
print("操作完成")
return True
except Exception as e:
print(f"操作失败: {e}")
return False
def main():
# 设置PyAutoGUI的安全设置
pyautogui.FAILSAFE = True
# 设置中文输入
pyautogui.PAUSE = 0.5 # 增加操作间隔时间
print("开始查找图片...")
# 查找图片
matches = find_image_on_screen('test.png')
if matches:
print(f"找到 {len(matches)} 个匹配位置")
for i, match in enumerate(matches, 1):
print(f"\n匹配 {i}:")
print(f"位置: 左={match['left']}, 上={match['top']}")
print(f"大小: {match['width']}x{match['height']}")
print(f"匹配度: {match['confidence']:.2%}")
# 移动鼠标并输入文字
interact_with_image(matches)
else:
print("未找到目标图片")
if __name__ == '__main__':
try:
main()
except KeyboardInterrupt:
print("\n程序已停止")
except Exception as e:
print(f"发生错误: {e}")
总结
本文介绍的方法可以实现屏幕图片定位和自动输入文字的功能,适用于自动化测试、重复性操作等场景。通过调整参数和添加更多功能,可以满足不同的自动化需求。
原文地址:https://blog.csdn.net/exlink2012/article/details/143908239
免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!