C# 关于 PaddleOCRSharp OCR识别的疲劳测试

🕗 发布于 2024-07-18 16:36 c# ocr 开发语言

关于 PaddleOCRSharp

应用范例演示

范例运行环境

关于 PaddleOCRSharp

PaddleOCRSharp 是百度飞桨封装的.NET版本 OCR dll 类库，OCR（Optical Character Recognition）工具可以将图像文件中的文本内容进行识别，转换成可编辑的文本格式。从而进一步进行编辑、存储和分析。

在实际的使用中，这款工具类库的确很优秀，无论从识别时间还是识别率来说，比较平衡比较令人满意。

应用范例演示

这是我们在实际应用中开发的一款工具，基于 Windows WinForm 模式，用于识别客户提供的电子档案中的文字，并进行文字识别存储及后续的管理。其主界面运行如下：

如图，工具程序在导入前提供了一些选项，包括：

（1）导入类型为图片数据和个人信息（这包括了导入文本到数据库的选项）

（2）跳过OCR识别功能，是为了直接导入图片到数据库，这里我们需要勾选掉以进行测试

（3）对已导入数据执行更新操作，这个选项是纯数据库更新操作

（4）不输出导出报告，是为了减少内存占用量，提升性能

快捷设置可以提供自动设置4个选项的目的。

工具程序提供了全目录全文件分析和单目录分析，全目录会遍历该目录下所有的电子图片进行识别操作，这里我们选择的是单目录文件分析（即选择一个目录，只查找该目录下所有的图片文件），并将最终的分析结果显示在报告框中。

在实际的运行应用中，我们的档案有共计几千万份图片，由于环境及硬件要求，仅提供了三台配置雷人的台式机，发现运行几小时后，PaddleOCRSharp.dll 运行崩溃报错，如下图：

因此需要对程序进行一些改进。

范例运行环境

操作系统： Windows Server 2019 DataCenter

PaddleOCRSharp版本：2.2.0.0

数据库：Microsoft SQL Server 2016

.net版本： .netFramework4.0 或以上

开发工具：VS2019 C#

疲劳测试

添加组件库

打 VS2019 创建 WinForm 应用，在解决方案资源管理器中添加引用，成功后如下图：

添加 using PaddleOCRSharp; 引用，示例如下：

using System;
using System.Collections.Generic;
using System.ComponentModel;
using System.Data;
using System.Drawing;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using System.Windows.Forms;
using PaddleOCRSharp;
using System.IO;
using System.Collections;
using System.Data.SqlClient;
using System.Diagnostics;
using System.Security.Cryptography;

方法设计

首先在 WinForm （实例假设为 Form1)，中初化如下变量，代码如下：

OCRModelConfig config = null;
OCRParameter oCRParameter = new OCRParameter();
PaddleOCREngine engi = null;
OCRResult ocrResult = new OCRResult();

说明表如下：

序号	参数名	类型	说明
1	config	OCRModelConfig	OCR模型的配置对象
2	oCRParameter	OCRParameter	OCR模型的识别参数对象
3	engi	PaddleOCREngine	OCR模型的识别引擎对象
4	ocrResult	OCRResult	OCR模型的识别结果对象

初始化对象是疲劳测试的关键设计，如果每次都 new 一个对象，系统运行一段时间后就会崩溃。

paddleOCR方法实现对于路径图片的文字识别提取，代码如下：

string paddleOCR(string imagepath)
{
            var imagebyte = File.ReadAllBytes(imagepath);
            

            oCRParameter.cpu_math_library_num_threads = 10;// 预测并发线程数
            oCRParameter.enable_mkldnn = false; // web部署该值建议设置为0，否则出错，内存如果使用很大，建议该值也设置为0.
            oCRParameter.cls = false; // 是否执行文字方向分类；默认false
            oCRParameter.use_angle_cls = false; // 是否开启方向检测，用于检测识别180旋转
            oCRParameter.det_db_score_mode = false; // 是否使用多段线，即文字区域是用多段线还是用矩形
            oCRParameter.det_db_unclip_ratio = 1.6f;
            

            engi = new PaddleOCREngine(config, oCRParameter);

            ocrResult = engi.DetectText(imagebyte);

            engi.Dispose();

            if (ocrResult != null)
            {
                return ocrResult.Text;
            }
            
            return "";
}

paddleOCR方法仅需要提供一个图片完整路径参数即可，方法中的参数对象需要说明一下，见下表：

序号	参数名	说明
1	cpu_math_library_num_threads	CPU预测时的线程数，在机器核数充足的情况下，该值越大，预测速度越快；在我们应用里设置为10
2	enable_mkldnn	即是否使用mkldnn库， web部署该值建议设置为false，否则出错，内存如果使用很大，建议该值也设置为false，在这里我们设置为false
3	cls	是否执行文字方向分类，在这里我们设置为false
4	use_angle_cls	是否开启方向检测，用于检测识别180旋转，在这里我们设置为false
5	det_db_score_mode	是否使用多段线，即文字区域是用多段线还是用矩形，在这里我们设置为false
6	det_db_unclip_ratio	表示文本框的紧致程度，越小则文本框更靠近文本,在这里我们使用了默认值 1.6f

调用示例

在Form上假设有按钮 Button1，则其点击事件的调用代码示例如下：

private void Button1_Click(object sender, EventArgs e)
{


   OpenFileDialog ofd = new OpenFileDialog();
   ofd.Filter = "*.*|*.bmp;*.jpg;*.jpeg;*.tiff;*.tiff;*.png";
   if (ofd.ShowDialog() != DialogResult.OK) return;
   string rv2 = paddleOCR(ofd.FileName);
   MessageBox.Show("共识别提取了"+rv2.Length.ToString()+"个文字\r\n"+ rv2, "识别结果");
   return;
}

小结

在实际的运行中，三台机器同时运行，有两台机器运行了7天以上暂无报错，一台运行了5天左右报错，唯一的区别在于报错机器的显卡配置较低，不同于其它两台机器。总体来说对于几个小时就会出错，提升了不少，也给我们监控运行状况提供了空间。

本实例是根据客户提供的电子图片类型、目录结构、JSON配置文件进行的定制开发，在实际应用我们要根据情况进行参数的设置和设计的调整，在测试中我们发现通过本实例的参数设置可以多识别出一些文字，而且识别率还是比较准确的。

本示例代码仅供您参考，感谢您的阅读，希望本文能够对您有所帮助。

原文地址：https://blog.csdn.net/michaelline/article/details/140483387

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Python进阶（3）--文件读写
下一篇：Linux 之 ln 硬链接和软链接

防火墙----iptables
防火墙会从以上至下的顺序来读取配置的策略规则，在找到匹配项后就立即结束匹配工作并去执行匹配项中定义的行为（即放行或阻止）。如果在读取完所有的策略规则之后没有匹配项，就去执行默认的策略。iptables
阅读更多2024-11-18
Python代码热流系统进行建模分析
从指定的Excel文件中读取与热流相关的数据，包括管径、长度、压力、流量、入口过冷焓等参数。根据读取的数据，利用库计算多种水的物性参数，如饱和焓值、密度、比热容、粘度等。通过一系列复杂的物理公式和迭代
阅读更多2024-11-18
二、vue指令
点击展开或收起时，把内容区域显⽰或者隐藏。v-bind:属性名="vue变量"指代事件对象传给事件处理函数。⽅便通过变量控制⼀套标签出现。修饰符给事件扩展额外功能。修饰符名即可使⽤
阅读更多2024-11-18
信奥学习规划（CSP-J/S)
CSP - J/S（非专业级软件能力认证 - 入门级 / 提高级）的信奥学习规划
阅读更多2024-11-18
ctfshow DSBCTF web部分wp
需要值不同而 md5 相同，有长度限制不能进行强碰撞，尝试数组绕过也不行，这里注意到可以让其类型不同而值相同进行绕过，构造 pop 链最后得到 flag。
阅读更多2024-11-18
【Linux】进程的优先级
cpu资源分配的先后顺序，就是指进程的优先权（priority）。优先权高的进程有优先执行权利。配置进程优先权对多任务环境的linux很有用，可以改善系统性能。还可以把进程运行到指定的CP
阅读更多2024-11-18
Linux—进程学习-02
进程相关的概念的学习【利用系统调用fork创建子进程】【利用fork实现多进程】【操作系统层面上进程状态运行、阻塞、挂起的理解和学习】【Linux操作系统具体的进程状态的理解和学习（R、S、T、t、D
阅读更多2024-11-18
HMI FUXA测试
FUXA是基于Web的，过程（SCADA、HMI、看板等）可视化软件。可创建现代的过程可视化，使用独立的设计器，显示机器和实时数据。。
阅读更多2024-11-18
基于Java Springboot城市交通管理系统
城市交通管理系统的目的是让使用者可以更方便的将人、设备和场景更立体的连接在一起。能让用户以更科幻的方式使用产品，体验高科技时代带给人们的方便，同时也能让用户体会到与以往常规产品不同的体验风格。这就意味
阅读更多2024-11-18
pytorch中的ImageFolder 用法
是 PyTorch 中模块提供的一个常用类，用于从文件夹中加载图像数据。它是一种非常方便的方式来加载按文件夹结构组织的图像数据集。这个类能够自动将文件夹中的子目录作为标签，并且将其中的图像文件加载为
阅读更多2024-11-18

C# 关于 PaddleOCRSharp OCR识别的疲劳测试

关于 PaddleOCRSharp

应用范例演示

​范例运行环境

疲劳测试

添加组件库

方法设计

调用示例

小结

相关文章

范例运行环境