测试几个 ocr 对日语的识别情况

🕗 发布于 2024-07-07 14:58 ocr

测试几个 ocr 对日语的识别情况

1. EasyOCR
2. PaddleOCR
3. Deepdoc（识别pdf中图片）
4. Deepdoc（识别pdf中文字）
5. Nvidia neva-22b
6. Claude 3.5 sonnet 识别图片中的文字
7. Claude 3.5 sonnet 识别 pdf 中表格
8. OpenAI gpt-4o 识别图片中文字
9. OpenAI gpt-4o 识别 pdf 中表格

1. EasyOCR

github: https://github.com/JaidedAI/EasyOCR

jaided: https://www.jaided.ai/easyocr/

测试图片：

在这里插入图片描述
识别效果：

在这里插入图片描述

结论：
效果不行

2. PaddleOCR

Github: https://github.com/PaddlePaddle/PaddleOCR

WebUI: https://aistudio.baidu.com/community/app/91660/webUI

测试图片：

在这里插入图片描述
识别效果：

在这里插入图片描述

结论：
效果不行

3. Deepdoc（识别pdf中图片）

Github: https://github.com/infiniflow/ragflow/tree/main/deepdoc

测试内容：

在这里插入图片描述
识别效果：

在这里插入图片描述
结论：
没识别成功

4. Deepdoc（识别pdf中文字）

Github: https://github.com/infiniflow/ragflow/tree/main/deepdoc

测试内容：

在这里插入图片描述
识别效果：

Oのra開c発le チDaーtaムbaはse、2A3Iとaiの開提発供者開の始生を産発性表向で上きにる重こ点とをを置嬉いしてく、思OrいacまleすD。atこabのas4e年の間次、のO長ra期cサle ポDaーtaトba・seリリースの提供に向けて懸命に取り組んできました。このリリースではAIに焦点を当てており、データベースの名前をOracle Database 23cからOracle Database 23aiに変更することを決定しました。これは、このリリースの焦点と、リリースされる情勢を反映しています。、のの焦点、情勢反映。

结论：
效果不行

5. Nvidia neva-22b

neva-22b: https://build.nvidia.com/nvidia/neva-22b

在这里插入图片描述
结论：
没识别出来

6. Claude 3.5 sonnet 识别图片中的文字

please identify the text in the picture, response the text only in it's original language.

在这里插入图片描述

7. Claude 3.5 sonnet 识别 pdf 中表格

Convert the entire table to markdown format, preserving its original language. Include all content from all pages, even if information is repeated across multiple pages. Present the complete table without omitting any sections.

在这里插入图片描述

8. OpenAI gpt-4o 识别图片中文字

在这里插入图片描述

9. OpenAI gpt-4o 识别 pdf 中表格

Please convert the entire table to Markdown format, preserving its original language. Include all content from all pages, even if information is repeated across multiple pages. Present the complete table without omitting any sections, and make sure to include any duplicated information exactly as it appears in the original document.

在这里插入图片描述
问题点：
表头被重复打印了

完结！

原文地址：https://blog.csdn.net/engchina/article/details/140216819

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：android iconfont带图标的图文并茂的一种实现
下一篇：手动安装Ruby 1.9.3并升级RubyGems

人工智能（AI）和机器学习（ML）技术学习流程
目录人工智能（AI）和机器学习（ML）技术自然语言处理（NLP）：Word2Vec：Seq2Seq（Sequence-to-Sequence）：Transformer：范式、架构和自注意力：多头注意力
阅读更多2024-11-07
如何使用闲置硬件搭建一个安装运行资源较少的Tipask问答网站服务器
今天和大家分享一下如何在Ubuntu系统上搭建一个Tipask私人问答网站，并结合cpolar内网穿透工具为本地站点配置公网地址，轻松实现无公网IP也能远程访问本地搭建的站点。
阅读更多2024-11-07
Android Studio 中的Gemini 推出更多人工智能开发功能
在未来的更新中，Android Studio 中的 Gemini 将允许开发人员为上下文附加自定义图片，从而使人工智能更容易创建美观、吸引人的 UI 界面。谷歌表示，人工智能集成不仅限于编码，还将扩展
阅读更多2024-11-07
【数据结构】选择排序——选择排序和堆排序
选择排序思路很简单就是经过将数组遍历选择最小值将最小值位置的数与数组最前面位置的数进行交换如此反复，完成排序为了提高效率我们在一次遍历过程中同时找最大和最小值。
阅读更多2024-11-07
CPU用户时间百分比
在计算机系统中，"CPU用户时间百分比（CPU User Time）"是一个性能监控指标，它描述了CPU在用户模式下执行的累积时间与总的CPU时间的比例。这个指标可以帮助我们了解系
阅读更多2024-11-07
(微服务)服务治理：几种开源限流算法库/应用软件介绍和使用
介绍几种 Go 开源限流算法库
阅读更多2024-11-07
idea-git 远程仓库代码回滚，本地仓库代码回滚，删除未加入git的文件
idea-git1、删除未加入git的文件2、IDEA工具使用Git回滚代码2.1、回滚本地仓库代码（只能回滚最近一次提交记录）2.2、回滚本地仓库代码（回滚到指定的提交记录）2.3、回滚远程仓库代码
阅读更多2024-11-07
【GIT】sourceTree的“当前分支“，“合并分支“与“检出分支的区别
操作作用描述场景示例当前分支当前活跃的分支，所有操作默认应用于当前分支工作在dev分支上并进行提交合并分支将一个分支的改动合并到当前分支，使两个分支的内容同步将feature分支合并到main分支进行
阅读更多2024-11-07
Vue2中使用firefox的pdfjs进行文件文件流预览
pdf链接或者pdf文件流的预览。
阅读更多2024-11-07
Linux中的apt update和apt upgrade区别
在Linux操作系统中，包管理是维护系统和软件更新的关键任务。apt（高级包装工具）是Debian及其衍生系统（如Ubuntu）中广泛使用的包管理器。本文将详细解释apt update和这两个常用命令
阅读更多2024-11-07

测试几个 ocr 对日语的识别情况

测试几个 ocr 对日语的识别情况

1. EasyOCR

2. PaddleOCR

3. Deepdoc（识别pdf中图片）

4. Deepdoc（识别pdf中文字）

5. Nvidia neva-22b

6. Claude 3.5 sonnet 识别图片中的文字

7. Claude 3.5 sonnet 识别 pdf 中表格

8. OpenAI gpt-4o 识别图片中文字

9. OpenAI gpt-4o 识别 pdf 中表格

相关文章