自学内容网 自学内容网

基于pytesseract的OCR图片识别

简介

pytesseract是基于谷歌的tesseract的OCR包,支持识别一些简单的数字、字母、中文。

安装

安装引擎

下载地址:https://digi.bib.uni-mannheim.de/tesseract/
一般是Windows 64位系统最新版:
1

如果要识别中文,注意选中中文模块。
1

下载
把tesseract.exe目录加入Path,如D:\Program Files\Tesseract-OCR

安装pytesseract包

pip install Pillow
pip install pytesseract

测试代码

1

from PIL import Image
import pytesseract

res = pytesseract.image_to_string(Image.open('test.jpg'), lang='chi_sim')
print(res)

1

相关链接

https://github.com/tesseract-ocr/tesseract


原文地址:https://blog.csdn.net/lilongsy/article/details/140381630

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!