HalconDotNet实现OCR详解

🕗 发布于 2024-09-26 19:44 ocr C# Halcon HalconDotNet

文章目录

一、基于字符分割的 OCR
二、基于模板匹配的 OCR
三、基于深度学习的 OCR
四、基于特征提取的 OCR
五、基于区域建议的 OCR

一、基于字符分割的 OCR

字符分割是 OCR 中的一个重要步骤。首先，对包含文本的图像进行预处理，如去噪、二值化等操作，以提高图像质量。然后，根据字符的特征，如连通区域、轮廓等，将图像中的字符分割出来。可以使用投影法、连通区域分析等方法进行字符分割。对于粘连的字符，可能需要进行特殊处理，如形态学操作或基于笔画宽度的分割方法。分割后的字符可以单独进行识别，提高识别的准确性。
C# 示例代码：

using HalconDotNet;

class CharacterSegmentationOCR
{
    public void PerformOCR()
    {
        // 读取图像
        HObject image = new HObject();
        HOperatorSet.ReadImage(out image, "text_image.jpg");

        // 预处理：二值化
        HObject binaryImage;
        HOperatorSet.Threshold(image, out binaryImage, 128, 255);

        // 连通区域分析进行字符分割
        HObject connectedRegions;
        HOperatorSet.Connection(binaryImage, out connectedRegions);

        // 对每个连通区域进行单独处理
        HTuple regionCount;
        HOperatorSet.CountObj(connectedRegions, out regionCount);
        for (int i = 1; i <= regionCount; i++)
        {
            HObject singleRegion;
            HOperatorSet.SelectObj(connectedRegions, out singleRegion, i);

            // 对单个字符区域进行识别，可以使用 Halcon 的 OCR 引擎
            HTuple recognizedText;
            using (new HOperatorSet())
            {
                HOperatorSet.ReadOcrClassMlp("ocr_model_file.omc", out recognizedText);
                HOperatorSet.DoOcrMultiClassMlp(singleRegion, recognizedText, out _, out _, out _, out _, out _, out _);
            }

            Console.WriteLine($"Recognized character: {recognizedText}");

            singleRegion.Dispose();
        }

        // 释放资源
        image.Dispose();
        binaryImage.Dispose();
        connectedRegions.Dispose();
    }
}

二、基于模板匹配的 OCR

模板匹配 OCR 方法首先创建一系列不同字符的模板图像。对于待识别的图像，将其与每个模板进行比较，计算相似度。相似度可以通过多种方式计算，如归一化互相关等。根据相似度最高的模板确定对应的字符。这种方法对于字体较为固定、图像质量较好的情况效果较好。但需要预先创建大量的模板，并且对于字体变化、变形等情况可能不够鲁棒。
C# 示例代码：

using HalconDotNet;

class TemplateMatchingOCR
{
    public void PerformOCR()
    {
        // 读取待识别图像
        HObject image = new HObject();
        HOperatorSet.ReadImage(out image, "text_image.jpg");

        // 加载字符模板
        HObject charTemplates = new HObject();
        for (char c = 'A'; c <= 'Z'; c++)
        {
            HObject template = new HObject();
            HOperatorSet.ReadImage(out template, $"template_{c}.jpg");
            charTemplates = charTemplates.ConcatObj(template);
            template.Dispose();
        }

        // 进行模板匹配
        HTuple recognizedCharacters = new HTuple();
        HTuple scores = new HTuple();
        HOperatorSet.FindTemplate(image, charTemplates, -0.39, 6.28, 0.5, 1, 0.5, out _, out scores);
        for (int i = 0; i < scores.Length; i++)
        {
            if (scores[i] > 0.8)
            {
                recognizedCharacters = recognizedCharacters.ConcatObj((HTuple)charTemplates[i]);
            }
        }

        Console.WriteLine($"Recognized text: {recognizedCharacters}");

        // 释放资源
        image.Dispose();
        charTemplates.Dispose();
    }
}

三、基于深度学习的 OCR

深度学习在 OCR 中取得了显著的成果。通过使用深度神经网络，如卷积神经网络（CNN）和循环神经网络（RNN）的组合，可以自动学习字符的特征，无需手动设计特征提取器。首先，收集大量的标注文本图像数据集，对神经网络进行训练。训练过程中，网络不断调整权重和参数，以最小化预测结果与真实标签之间的误差。在识别阶段，将待识别图像输入训练好的网络，网络输出预测的字符序列。深度学习方法对于复杂背景、字体变化、变形等情况具有较好的鲁棒性。
C# 示例代码：

using HalconDotNet;
using Halcon.OCR;

class DeepLearningOCR
{
    public void PerformOCR()
    {
        // 读取图像
        HObject image = new HObject();
        HOperatorSet.ReadImage(out image, "text_image.jpg");

        // 创建 OCR 引擎
        HOcrEngine ocrEngine = new HOcrEngine();
        ocrEngine.InitOcrEngine("deep_learning_model_file.omc");

        // 进行 OCR 识别
        HTuple recognizedText;
        ocrEngine.ApplyOcr(image, out recognizedText);

        Console.WriteLine($"Recognized text: {recognizedText}");

        // 释放资源
        image.Dispose();
        ocrEngine.Dispose();
    }
}

四、基于特征提取的 OCR

特征提取是 OCR 中的关键步骤之一。通过提取字符的特征，可以减少数据维度，提高识别的效率和准确性。常见的特征包括几何特征（如字符的高度、宽度、面积等）、统计特征（如灰度直方图、矩特征等）和结构特征（如字符的笔画结构、轮廓特征等）。对于不同的字体和图像质量，可以选择不同的特征组合。然后，使用分类器对提取的特征进行分类，确定字符的类别。
C# 示例代码：

using HalconDotNet;

class FeatureExtractionOCR
{
    public void PerformOCR()
    {
        // 读取图像
        HObject image = new HObject();
        HOperatorSet.ReadImage(out image, "text_image.jpg");

        // 预处理：二值化
        HObject binaryImage;
        HOperatorSet.Threshold(image, out binaryImage, 128, 255);

        // 连通区域分析
        HObject connectedRegions;
        HOperatorSet.Connection(binaryImage, out connectedRegions);

        // 提取特征
        HTuple features = new HTuple();
        HTuple regionCount;
        HOperatorSet.CountObj(connectedRegions, out regionCount);
        for (int i = 1; i <= regionCount; i++)
        {
            HObject singleRegion;
            HOperatorSet.SelectObj(connectedRegions, out singleRegion, i);

            // 提取几何特征和统计特征
            HTuple area, width, height;
            HOperatorSet.AreaCenter(singleRegion, out area, out _, out _);
            HOperatorSet.RegionFeatures(singleRegion, "width", out width);
            HOperatorSet.RegionFeatures(singleRegion, "height", out height);

            features = features.ConcatObj(area.ConcatObj(width.ConcatObj(height)));

            singleRegion.Dispose();
        }

        // 使用分类器进行识别
        HTuple recognizedCharacters;
        // 假设已经训练好分类器
        // 使用分类器对特征进行分类，得到识别结果
        recognizedCharacters = Classifier.Predict(features);

        Console.WriteLine($"Recognized text: {recognizedCharacters}");

        // 释放资源
        image.Dispose();
        binaryImage.Dispose();
        connectedRegions.Dispose();
    }
}

五、基于区域建议的 OCR

区域建议方法首先在图像中生成可能包含字符的区域建议。可以使用基于深度学习的目标检测算法，如 Faster R-CNN 等，来生成区域建议。然后，对每个区域建议进行字符识别。这种方法可以有效地处理复杂背景下的文本识别问题，并且可以同时识别多个字符区域。通过对区域建议进行筛选和合并，可以提高识别的准确性和效率。
C# 示例代码：

using HalconDotNet;
using Halcon.OCR;

class RegionProposalOCR
{
    public void PerformOCR()
    {
        // 读取图像
        HObject image = new HObject();
        HOperatorSet.ReadImage(out image, "text_image.jpg");

        // 创建 OCR 引擎
        HOcrEngine ocrEngine = new HOcrEngine();
        ocrEngine.InitOcrEngine("ocr_model_file.omc");

        // 使用区域建议算法生成可能的字符区域
        HObject regionProposals;
        // 假设已经有区域建议算法生成的区域
        regionProposals = GenerateRegionProposals(image);

        // 对每个区域进行 OCR 识别
        HTuple recognizedText = new HTuple();
        HTuple regionCount;
        HOperatorSet.CountObj(regionProposals, out regionCount);
        for (int i = 1; i <= regionCount; i++)
        {
            HObject singleRegion;
            HOperatorSet.SelectObj(regionProposals, out singleRegion, i);

            HTuple tempRecognizedText;
            ocrEngine.ApplyOcr(singleRegion, out tempRecognizedText);
            recognizedText = recognizedText.ConcatObj(tempRecognizedText);

            singleRegion.Dispose();
        }

        Console.WriteLine($"Recognized text: {recognizedText}");

        // 释放资源
        image.Dispose();
        regionProposals.Dispose();
        ocrEngine.Dispose();
    }

    private HObject GenerateRegionProposals(HObject image)
    {
        // 这里假设使用一个虚构的区域建议算法生成区域
        HObject dummyRegions = new HObject();
        // 根据具体需求生成区域建议并返回
        return dummyRegions;
    }
}

原文地址：https://blog.csdn.net/weixin_48083386/article/details/142450715

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：RPA自动化流程机器人有哪些优势？
下一篇：DBAPI如何实现插入数据前先判断数据是否存在，存在就更新，不存在就插入

leetcode289:生命游戏
根据，简称为，是英国数学家约翰·何顿·康威在 1970 年发明的细胞自动机。给定一个包含m × n个格子的面板，每一个格子都可以看成是一个细胞。每个细胞都具有一个初始状态：1即为（live），或0即为
阅读更多2024-10-20
MongoDB数据恢复
注意：两个MongoDB的版本要一致，本文使用的是mongo:4.2.24。先把K8S上面的MongoDB 容器停止（可以把副本改成0）。1、将容器挂载MongoDB的数据目录备份到本地。经常是数据文
阅读更多2024-10-20
C#中实现事务
C#中实现事务
阅读更多2024-10-20
【LeetCode每日一题】——560.和为 K 的子数组
给你一个整数数组 nums 和一个整数 k ，请你统计并返回该数组中和为 k 的子数组的个数。子数组是数组中元素的连续非空序列。
阅读更多2024-10-20
「漏洞复现」满客宝智慧食堂系统 selectUserByOrgId 未授权访问漏洞
请勿利用文章内的相关技术从事非法测试，由于传播、利用此文所提供的信息而造成的任何直接或者间接的后果及损失，均由使用者本人负责，作者不为此承担任何责任。工具来自网络，安全性自测，如有侵权请联系删除。本次
阅读更多2024-10-20
React面试题目（从基本到高级）
React前端面试常见题目涵盖了React的基础概念、组件、状态管理、生命周期、性能优化等多个方面。
阅读更多2024-10-20
12.个人博客系统（Java项目基于spring和vue）
1 在校学习的学生，可用于日常学习使用或是毕业设计使用 2 毕业一到两年的开发人员，用于锻炼自己的独立功能模块设计能力，增强代码编写能力。 3 亦可以部署为商化项目使用。 4 需要完整资料及源码
阅读更多2024-10-20
YoloV8改进策略：注意力改进|DeBiFormer，可变形双级路由注意力|引入DeBiLevelRoutingAttention注意力模块（全网首发）
本次改进的核心在于将DeBiLevelRoutingAttention模块嵌入到YoloV8的主干网络中，具体位置是在SPPF（Spatial Pyramid Pooling Fast）模块之后。这一
阅读更多2024-10-20
word取消自动单词首字母大写
情况说明：在word输入单词后首字母会自动变成大写取消单词首字母大写步骤：（1）点击菜单栏文件（2）点击“更多”——>“选项”（3）点击“校对”——>“自动更正选项”（4）取消“句首字母大
阅读更多2024-10-20
web前端网页用户注册页面
【代码】web前端网页用户注册页面。
阅读更多2024-10-20