EmguCV学习笔记 C# 12.3 OCR

🕗 发布于 2024-09-23 14:24 c# 计算机视觉 opencv emgucv ocr

版权声明：本文为博主原创文章，转载请在显著位置标明本文出处以及作者网名，未经作者允许不得用于商业目的。

EmguCV是一个基于OpenCV的开源免费的跨平台计算机视觉库,它向C#和VB.NET开发者提供了OpenCV库的大部分功能。

教程VB.net版本请访问：EmguCV学习笔记 VB.Net 目录-CSDN博客

教程C#版本请访问：EmguCV学习笔记 C# 目录-CSDN博客

笔者的博客网址：https://blog.csdn.net/uruseibest

教程配套文件及相关说明以及如何获得pdf教程和代码，请移步：EmguCV学习笔记

学习VB.Net知识，请移步： vb.net 教程目录_vb中如何用datagridview-CSDN博客

学习C#知识，请移步：C# 教程目录_c#教程目录-CSDN博客

12.3 OCR

EmguCV中使用Tesseract类进行文字识别。

Tesseract类的构造函数：

public Tesseract(

string dataPath,

string language,

OcrEngineMode mode,

string whiteList = null,

bool enforceLocale = true

)

参数说明：

dataPath：存放语言识别模型文件的目录，该目录必须是tessdata。
language：要用来识别的语言，例如简体中文是chi_sim.traineddata，英文是eng.traineddata。如果需要识别的内容包含多种语言，那么这里需要使用加号连接，如：chi_sim+eng，将加载简体中文和英语。需要注意的是，加载额外的语言将影响速度和准确性。
mode：OCR引擎模式。这是一个OcrEngineMode枚举，它包含四个成员：TesseractOnly：速度最快；LstmOnly：精度最好，但是速度慢；TesseractLstmCombined：速度和精度比较平衡；Default：自动选择上述三种引擎。
whiteList：用于指定OCR的白名单。例如，指定“1234567890”仅识别数字。请注意，白名单目前只适用于OcrEngineModel.OEM_TESSERACT_only
enforceLocale：指定是否强制使用特定的区域设置。当设置为 True 时，Tesseract将强制使用特定的区域设置，这意味着它将使用与指定区域设置相关的语言模型和字典进行文本识别。例如，如果您希望在美国使用 Tesseract，可以将 enforceLocale 参数设置为 True，并将区域设置设置为 "en_US"。这样，Tesseract 将使用与美国英语相关的语言模型和字典进行文本识别，从而提高识别准确性。相反，如果将 enforceLocale 参数设置为 False，Tesseract 将不会强制使用特定的区域设置，而是使用默认的区域设置进行文本识别。

具体操作步骤：

经过构造函数后，通过SetImage方法传入需要OCR的图像，Recognize方法识别图像，但是该方法不会直接返回结果，而是通过GetUTF8Text方法获得识别出的字符串，或者通过GetCharacters方法获得Tesseract.Character结构数组，Tesseract.Character结构包含了识别出的字符串和字符串所在的区域坐标。

【代码位置：frmChapter12】Button4_Click

//OCR识别

private void Button4_Click(object sender, EventArgs e)

{

//使用中文

Tesseract ocr = new Tesseract("C:\\learnEmgucv\\tessdata", "chi_sim", OcrEngineMode.LstmOnly);

//如果中英文都要使用，那么使用加号连接。但不要超过2个语言。

//Tesseract ocr = new Tesseract("C:\\learnEmgucv\\tessdata", "chi_sim+eng", OcrEngineMode.LstmOnly);

Mat m = new Mat("C:\\learnEmgucv\\ocr2.jpg", ImreadModes.Color);

ImageBox1.Image = m;

//设置需要识别文字的图像

ocr.SetImage(m);

//识别

ocr.Recognize();

//获得识别结果

string textout;

textout = ocr.GetUTF8Text();

Console.WriteLine(textout);

//标记识别区域

Tesseract.Character[] charout;

charout = ocr.GetCharacters();

for (int i = 0; i < charout.Length; i++)

CvInvoke.Rectangle(m, charout[i].Region, new MCvScalar(0, 0, 255), 1);

ImageBox2.Image = m;

}

输出结果如下图所示：

图12-4 OCR获得图像中的文字

需要注意的是，识别结果和传入的图像质量有关系，请在识别前做好图像处理。

原文地址：https://blog.csdn.net/UruseiBest/article/details/142373834

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：4.结构型设计模式 - 第1回：引言与适配器模式 (Adapter Pattern) ——设计模式入门系列
下一篇：UDP Socket聊天室（Java）

Qt获取本机Mac地址、Ip地址
今天给大家分享一个获取本机IP地址和Mac地址的方法，经过多次测试，台式机、笔记本等多个设备，暂时没有发现问题。由于很多时候本地安装了虚拟机、蓝牙、无线网卡或者其他设备等，会有多个Mac地址，所以需要
阅读更多2024-09-25
【JVM】JVM执行流程和内存区域划分
`Java` 不想重新编译，而是期望能够直接执行- 先通过 `javac` 把 `.java` 文件==> `.class` 文件（字节码文件，包含的就是 `Java` 字节码，`Java` 自
阅读更多2024-09-25
PR视频剪辑工具全指南：开启专业剪辑之旅
pr视频剪辑可以说是视频剪辑里的一把好手，就是如果你想在这方面深耕那还是掌握这个工具的使用比较方便。如果你只是刚入门，那也有不少可以快速帮你剪辑出片的工具。这次我介绍几款我用过的视频剪辑工具，助你开启
阅读更多2024-09-25
Mac电脑上最简单安装Python的方式
最简单在 Mac 电脑上安装 Python 解释器的方法
阅读更多2024-09-25
Flask建立的Web网站的can‘t open file C_Program问题的分析
考虑到私有化的大模型都是Python编写为主的。但是，用PyCharm进行调试的时候却出现了问题。所以，只有在Flask的Pycharm的调试模式下要出现异常。但是，调试模式不得不用，因为断点跟踪可以
阅读更多2024-09-25
用Flutter几年了，Flutter每个版本有什么区别？
用Flutter几年了，你知道Flutter每个版本有什么区别吗？不管是学习还是面试我们可能都需要了解这个信息。Flutter 每个版本的用法基本都是一样的，每隔几天或者几周就会更新一个版本，2018
阅读更多2024-09-25
Vue.js与Flask/Django后端配合
通过以上步骤，你可以成功地将Vue.js前端与Flask或Django后端进行组合，实现一个全栈的Web应用。这样可以充分利用前后端各自的优势，构建高效、灵活的Web应用。
阅读更多2024-09-25
学习篇 | Dockerized GitLab 安装使用（简单实操版）
浏览器访问 http://localhost:1080，第一次访问需要等几分钟，在页面上创建 root 账户后正常使用。
阅读更多2024-09-25
基于Python+flask+MySQL+HTML的全国范围水质分析预测系统，可视化用echarts，预测算法随机森林
通过系统功能模块的准确性和可靠性验证，采用功能测试用例编写及测试总结方法。总计设计并实施了8项功能测试用例。所有测试用例的执行均已通过验证。所有核心功能，包括用户认证、信息展示、数据分析及预测模块，均
阅读更多2024-09-25
MyBatis-Mapper 接口与 XML 映射
Mapper 接口是一种直接使用 Java 接口与 SQL 语句进行绑定的方式。Mapper 接口允许我们通过编写接口的方法名，来代替传统的手写 SQL 代码，使得开发更加简洁。MyBatis 会根据
阅读更多2024-09-25

EmguCV学习笔记 C# 12.3 OCR

12.3 OCR

相关文章