python识别ocr 图片和pdf文件

🕗 发布于 2024-11-07 05:58 python ocr pdf

#识别图片
pip3 install paddleocr
pip3 install paddlepaddle


#识别pdf
pip3 install PyMuPDF

重点：路径不能有中文，不然pdf文件访问不了

from paddleocr import PaddleOCR
from rest_framework.response import Response
from rest_framework.views import APIView


# 识别单张图片
class GetOneImage(APIView):
    def get(self, request, *args, **kwargs):
        ocr = PaddleOCR(use_angle_cls=True, lang="ch")  # need to run only once to download and load model into memory
        img_path = 'F:/OCR/data/4.png'
        result = ocr.ocr(img_path, cls=True)
        for idx in range(len(result)):
            res = result[idx]
            for line in res:
                print(line)

        # 显示结果
        for idx in range(len(result)):
            res = result[idx]
            txts = [line[1][0] for line in res]
        return Response({'code': 200, "data": txts})


import datetime
import fitz  # fitz就是pip install PyMuPDF
import os
import cv2
from paddleocr import PPStructure
from paddleocr.ppstructure.recovery.recovery_to_doc import sorted_layout_boxes

# 中文测试图
table_engine = PPStructure(recovery=True, lang='ch')


#识别pdf
class GetPDF(APIView):
    def get(self, request, *args, **kwargs):
        pdfPath = "F:/OCR/image/13.pdf";
        imagePath = "F:/OCR/image/13"
        startTime_pdf2img = datetime.datetime.now()  # 开始时间
        print("imagePath=" + imagePath)
        if not os.path.exists(imagePath):
            os.makedirs(imagePath)
        pdfDoc = fitz.open(pdfPath)
        totalPage = pdfDoc.page_count
        for pg in range(totalPage):
            page = pdfDoc[pg]
            rotate = int(0)
            zoom_x = 2
            zoom_y = 2
            mat = fitz.Matrix(zoom_x, zoom_y).prerotate(rotate)
            pix = page.get_pixmap(matrix=mat, alpha=False)
            print(f'正在保存{pdfPath}的第{pg + 1}页，共{totalPage}页')
            pix.save(imagePath + '/' + f'images_{pg + 1}.png')
        endTime_pdf2img = datetime.datetime.now()
        print(f'{pdfDoc}-pdf2img-花费时间={(endTime_pdf2img - startTime_pdf2img).seconds}秒')
        img_path = imagePath;
        text = []
        imgs = os.listdir(img_path)
        for img_name in imgs:
            img = cv2.imread(os.path.join(img_path, img_name))
            result = table_engine(img)
            h, w, _ = img.shape
            res = sorted_layout_boxes(result, w)
            for line in res:
                line.pop('img')
                print(line)
                for pra in line['res']:
                    text.append(pra['text'])
                text.append('\n')
        return Response({'code': 200, "data": text})

参考：使用paddleOCR批量识别pdf_paddleocr pdf-CSDN博客

原文地址：https://blog.csdn.net/qq_41709084/article/details/143574356

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

海外媒体发稿与宣发：拓展全球影响力的关键-大舍传媒
总之，海外媒体发稿与宣发是一项综合性的工作，需要精心策划、持续投入和专业的执行。通过掌握正确的策略和技巧，充分利用这一工具，您将能够在国际舞台上大放异彩，实现拓展全球影响力的目标。无论是企业寻求业务增
阅读更多2024-11-07
OBOO鸥柏丨传媒广告行业的创新应用解决数字技术短板
OBOO鸥柏立式广告机作为这一领域的创新显示产品新技术，搭载VS6.0/满天星(MTSTAR)信息发布系统网络云平台技术科技，以其独特的技术优势和卓越的展览展示宣传播放应用效果，鸥柏信发系统远程集中管
阅读更多2024-11-07
SSLHandshakeException错误解决方案
导致，不同https安全协议不一致，TLS协议版本越高，HTTPS通信的安全性越高，但是相较于低版本TLS协议，高版本TLS协议对浏览器的兼容性较差。查阅资料，确定是由于JDK版本问题，测试项目中使用
阅读更多2024-11-07
C语言 | Leetcode C语言题解之第541题反转字符串II
C语言 | Leetcode C语言题解之第541题反转字符串II
阅读更多2024-11-07
wps怎么算出一行1和0两种数值中连续数值1的个数,出现0后不再计算？
在WPS表格中，要计算一行中连续1的个数，并且在遇到0之后停止计数，可以使用一个自定义的公式。假设你的数据存储在A1到A10的单元格中，你可以使用以下步骤来实现这个目标。这个公式表示：如果A2是1，则
阅读更多2024-11-07
STM32中，定时器使用ETR引脚和使用APB1时钟是否一致？
例如，当使用ETR引脚作为定时器的触发源时，可能需要配置定时器的时钟源为APB1时钟（或其他适当的时钟源），以确保定时器能够正确地响应外部触发信号并进行计数。在STM32中，定时器的时钟源可以选择来自
阅读更多2024-11-07
【c++语言程序设计】字符串与浅层复制（深拷贝与浅拷贝）
适合处理结构化文本输入，指定分隔符来分割输入内容，例如CSV文件的逐行读取。
阅读更多2024-11-07
产品如何3D建模？如何根据使用场景选购3D扫描仪？
随着科技的飞速发展，3D模型已从昔日的小众应用转变为各行各业不可或缺的利器。在文博、电商、家居、汽车、建筑及游戏影视等众多领域，3D模型以其直观、真实的视觉体验发挥着至关重要的作用。它不仅使用户能深入
阅读更多2024-11-07
赠你一只金色的眼 - 富集分析和表达数据可视化
GOplot包用于生物数据的可视化。更确切地说，该包将表达数据与功能分析的结果整合并进行可视化。但是要注意该包不能用于执行这些分析，只能把分析结果进行可视化。在所有科学领域，由于空间限制和结果所需的简
阅读更多2024-11-07
【蓝桥杯选拔赛真题78】python电话号码第十五届青少年组蓝桥杯python选拔赛真题算法思维真题解析
给定一个长度为 11 的字符串 S，表示电话号码，然后将电话号码中第三位数字后的连续四位数字用"*"替换，并输出替换后的字符串。例如:S ="13900001234&qu
阅读更多2024-11-07

python识别ocr 图片和pdf文件

相关文章