自学内容网 > 正文

基于pytesseract的OCR图片识别

🕗 发布于 2024-07-13 21:17 ocr

简介

pytesseract是基于谷歌的tesseract的OCR包，支持识别一些简单的数字、字母、中文。

安装

安装引擎

下载地址：https://digi.bib.uni-mannheim.de/tesseract/
一般是Windows 64位系统最新版：

如果要识别中文，注意选中中文模块。

把tesseract.exe目录加入Path，如D:\Program Files\Tesseract-OCR。

安装pytesseract包

pip install Pillow
pip install pytesseract

测试代码

from PIL import Image
import pytesseract

res = pytesseract.image_to_string(Image.open('test.jpg'), lang='chi_sim')
print(res)

相关链接

https://github.com/tesseract-ocr/tesseract

原文地址：https://blog.csdn.net/lilongsy/article/details/140381630

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：【SQL】如何实现 MySQL 事务的四⼤特性
下一篇：装饰模式：动态扩展对象的功能

C#绑定窗口句柄，获取后台窗口的图片的实现与分析
通过使用C#结合Windows API，我们可以实现对后台窗口的图像获取。尽管过程中涉及许多底层操作，但通过合理使用这些API，能够有效地获取我们需要的数据。希望本文的代码示例和解释对实现此功能有所帮
阅读更多2024-11-08
1. pytorch 中冻结模型参数后参数仍会被调整
起初设置 requires_grad(False) 优化器也没有添加sgfnet的模型参数。但是在pylightning框架中，每次推理完模型的参数都会被改变，经过仔细排查发现问题。
阅读更多2024-11-08
Maven
项目构建是指将源代码、配置文件、资源文件等转化为能够运行或部署的应用程序或库的过程, Maven可以管理项目的编译、测试、打包、部署等构建过程。那么可以将需要的依赖项的信息编写到Maven工程的配置
阅读更多2024-11-08
【K8S问题系列】Kubernetes Pod节点CrashLoopBackOff 状态【已解决】
在 Kubernetes 中，Pod 的状态为 **`CrashLoopBackOff`** 表示某个容器在启动后崩溃，Kubernetes 尝试重启该容器，但由于持续崩溃，重启的间隔时间逐渐增加。
阅读更多2024-11-08
Flutter 中的那些设计模式的写法（持续更新）
我们都知道设计模式是相同的，同一种设计模式的理念不会因为语言不同而会有所改变，但是由于语法的差异，设计模式的写法也有所差异，本文会介绍一些flutter中常用设计模式的写法以及使用场景。创建型模式单例
阅读更多2024-11-08
vue.js组件和传值以及微信小程序组件和传值
记录微信小程序组件与uniapp组件的引用以及传值的问题
阅读更多2024-11-08
React 中 `key` 属性的警告及其解决方案
React 中 `key` 属性的警告及其解决方案
阅读更多2024-11-08
icloud域名邮箱优势分析：烽火邮箱怎么样？
icloud域名邮箱凭借其专业的品牌形象、高级别的安全性、无缝的设备同步和强大的功能。烽火邮箱，媲美iCloud域名邮箱，企业邮箱专业稳定，支持自定义域名，短期邮箱也灵活，打造高效商务沟通！
阅读更多2024-11-08
React 源码学习01 ---- React.Children.map 的实现与应用
目前是第一次看这个函数的实现，知道他大概干了什么，也大概明白每一步要干什么，但是目前还不清除他为什么要这么干。为什么要来看他的实现呢？一个是只有知道他是怎么实现的，才能知道在调用这个方法时，那些情况会
阅读更多2024-11-08
Go-性能调优实战案例
AB实验SDK优化分析基础库的核心逻辑和性能瓶颈压测验证落地验证。单独的benchmark无法满足复杂逻辑分析压测（单机器集群）并且问题还有：cpu占用80%和40%的数据是不一样的都采样
阅读更多2024-11-08