Python代码优雅解析PDF文件

🕗 发布于 2024-11-05 11:52 pdf pdfplumber python

主要功能：利用Python扩展库pdfplumber解析中文核心期刊要目总览.pdf文件成excel文件

解析文件：中文核心期刊要目总览.pdf

具体代码：

import pdfplumber
import pandas as pd

with pdfplumber.open("hexin.pdf") as pdf:
    print(len(pdf.pages))
    first = pdf.pages[0]
    ftable = first.extract_table()
    tables = ftable[2:]
    for page in pdf.pages[1:]:
        tables += page.extract_table()
    data_frame = pd.DataFrame(tables, columns=ftable[1])
    with pd.ExcelWriter('hexin.xlsx') as excel:
        data_frame.to_excel(excel, index=False)

原文地址：https://blog.csdn.net/u013378469/article/details/143433507

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：新视野大学英语读写教程1第四版PDF+答案+听力音频
下一篇：WorkFlow源码剖析——Communicator之TCPServer（中）

计算机网络：网络层 —— 路由信息协议 RIP
路由信息协议(Routing Information Protocol，RIP)，是一种基于距离矢量算法的动态路由协议，主要用于在计算机网络中选择最佳路径，并确保数据包能够正确地从源地址传输到目的地址
阅读更多2024-11-05
【P2-6】ESP8266 WIFI模块在STA模式下实现UDP与电脑/手机网络助手通信——UDP数据透传
完成ESP8266 WIFI模块在STA模式下实现UDP与电脑/手机网络助手通信——实现UDP数据透传。STA模式，通俗来说就是模块/单片机去连接路由器/热点来通信。UDP协议，是传输层协议，UDP没
阅读更多2024-11-05
Stable diffusion 3.5本地运行环境配置记录
一名古代风格的中国女学生坐在现代的计算机教室里面学习编程”安装transformer和tokenizer。Jupyter能使用Anaconda虚环境。解决：安装高于Pytorch>2.0。安装量
阅读更多2024-11-05
【基于轻量型架构的WEB开发】课程作业2 mybatis关联查询、缓存、注解
在@Results注解中，可以包含多个@Result注解，一个@Result注解完成实体类中一个属性和数据表中一个字段的映射。：MyBatis中，@Param注解的功能是指定SQL语句中的参数，通常用
阅读更多2024-11-05
在Android开发中，如何获取手机设备中的所有文件信息？
访问应用的私有存储：使用等方法获取应用的私有目录中的文件信息。访问共享存储的文件：在 Android 10 及更高版本，使用MediaStore访问公开文件（例如图片、视频、音频等）。访问特定的文件路
阅读更多2024-11-05
【Stable Diffusion】
由于embeddings模型本质是提词打包，所以这类虽然节省模型的体积通常很小(通常几kb)空间资源，但由于体积小所携带的信息少，所以现在使用这种模型的也越来越少了。简单来说就是修正出图的颜色，如果不
阅读更多2024-11-05
【k8s】-容器内排查网络问题
容器内没有tcdump、route、ifconfig等网络命令，给我们网络调试、排查问题带来了很大的困难。我们知道，容器有自已的网络命名空间，所以我们。以上就和我们进入容器运行tcpdump命令抓取报
阅读更多2024-11-05
k8s 查看cpu使用率最高的pod
在 Kubernetes 中，可以使用命令查看 Pod 的资源使用情况，从而找到 CPU 使用率最高的 Pod。
阅读更多2024-11-05
人工智能技术在网络安全领域被恶意利用
【代码】人工智能技术在网络安全领域被恶意利用。
阅读更多2024-11-05
Go 语言之搭建通用 Web 项目开发脚手架
MVC 模式代表 Model-View-Controller（模型-视图-控制器）模式。这种模式用于应用程序的分层开发。web_app2/web_app2 执行，viper 读取配置文件失败，找不到
阅读更多2024-11-05

Python代码优雅解析PDF文件

相关文章