python-docx -- 读取word页眉、页脚

🕗 发布于 2024-11-25 12:55 python word python-docx

文章目录

sections介绍
访问section
添加section
页眉、页脚
综合案例：

sections介绍

word支持section的概念，即一个文档的划分部分，不同的部分均包含相同的页面布局设置，如相同的边距、页面方向等；
在每个section中可以定义页眉、页脚来应用于该section下的所有页面；
大部分word文档中都是默认有一个section;

访问section

>>> document = Document("xx.docx")
>>> sections = document.sections
>>> sections
<docx.parts.document.Sections object at 0x1deadbeef>
>>> len(sections)
3
>>> section = sections[0]

添加section

>>> current_section = doc.sections[-1]  
>>> current_section.start_type
NEW_PAGE (2)
>>> new_section = doc.add_section(WD_SECTION.ODD_PAGE)
>>> new_section.start_type
ODD_PAGE (4)

section对象有11个属性：

section.start_type，该部分的中断类型；

from docx.enum.section import WD_SECTION

section = document.sections[0]
section.start_type = WD_SECTION.NEW_PAGE

section.orientation，页面方向，如portrait 纵向，landscape横向；
section.page_width 页面宽度；如Inches(8.5)；
section.page_height 页面高度；
section.left_margin 文本内容距离页面的左边距；
section.right_margin 右边距；如1143000，可以继续调用right_margin属性.inches/pt/cm 获取对应单位的距离值；
section.top_margin 上边距；
section.bottom_margin 下边距；
section.gutter
section.header_distance 与页眉的距离；
section.footer_distance 与页脚的距离；

页眉、页脚

每个section对象有自己的页眉、页脚，
访问方式：

>>> section = doc.sections[0]
>>> header = section.header
>>> header
<docx.section._Header object at 0x...>
>>> footer = section.footer

>>> header._element   # 获取底层的xml元素，依次遍历内部的CT_P、CT_Tbl对象并解析即可；
>>> footer._element

综合案例：

在word中添加如下页眉内容，并解析（解析页脚类似）：

四个段落文本；
一个表格；
一个图片；
一个矩形框图形；

完整代码：


def get_graphic_with_pywin32(doc_path):
    """ 基于pywin32 解析文档主体中的图形 """
    global graphics
    word = get_word_instance()
    doc = word.Documents.Open(doc_path)
    for section in doc.Sections:
        for header in section.Footers:
            for shape in header.Shapes:
                inline_shape = shape.ConvertToInlineShape()
                bdata = inline_shape.Range.EnhMetaFileBits.tobytes()  # 直接保存无法查看
                img = PillowImage.open(BytesIO(bdata))
                img.save("./{}.png".format(shape.Name))
                with open("./{}.png".format(shape.Name), "rb") as f:
                    bdata = f.read()  # 读取的字节 与 image.tobytes() 不一样
                graphics[

原文地址：https://blog.csdn.net/weixin_45228198/article/details/144005766

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Ros2 操作指令记录
下一篇：Python操作neo4j库py2neo使用之创建和查询（二）

《图像形态学运算全解析：原理、语法及示例展示》
简介：本文详细介绍了图像形态学中的多种运算，包括腐蚀、膨胀、开运算、闭运算、形态学梯度运算、礼帽运算以及黑帽运算。分别阐述了各运算的原理、语法格式，并通过 Python 代码结合具体示例图片（如er
阅读更多2024-11-25
大连环保公益管理系统｜Java｜SSM｜Vue｜前后端分离
2⃣️：管理端：首页、个人中心、用户管理、用户环保币管理、环保币入账管理、环保币扣减管理、商品兑换管理、加入环保社团管理、活动报名管理、众筹支持管理、环保活动管理。4⃣️：环保社团端：首页、个人中心、
阅读更多2024-11-25
微信小程序条件渲染与列表渲染的全面教程
在微信小程序的开发中，条件渲染和列表渲染是构建动态用户界面的重要技术。通过条件渲染，我们可以根据不同的状态展示不同的内容，而列表渲染则使得我们能够高效地展示一组数据。本文将详细讲解这两种渲染方式的用法
阅读更多2024-11-25
docker基础命令
docker基础命令
阅读更多2024-11-25
【FPGA开发】Vivado自定义封装IP核，绑定总线
一般xilinx官方的bd中涉及的总线，都会可以直接映射的选，如果是自己定义的总线协议，也可以增加自定义。想把连接ram的端口绑定在一起，这样在BD中连线时，就不用一根根的拉线，就可以一个总线搞定。在
阅读更多2024-11-25
MATLAB 批量读取endnote导出的参考文献
endnote中有很多分组文件夹，如果批量导出。
阅读更多2024-11-25
实验二系统响应及系统稳定性
（1）学会运用Matlab 求解离散时间系统的零状态响应；（2）学会运用Matlab 求解离散时间系统的单位取样响应；（3）学会运用Matlab 求解离散时间系统的卷积和。
阅读更多2024-11-25
Spring：AOP切入点表达式
对于AOP中切入点表达式，我们总共会学习三个内容，分别是语法格式通配符和书写技巧。
阅读更多2024-11-25
【JavaEE进阶】 JavaScript
创建数组有两种⽅式1. 使⽤ new 关键字创建// Array 的 A 要⼤写2. 使⽤字⾯量⽅式创建 [常⽤]// 数组中保存的内容称为 "元素"注意: JS 的数组不要求元素
阅读更多2024-11-25
Java SE 与 Java EE：基础与进阶的探索之旅
Java SE 是 Java 的标准版，它提供了 Java 语言的基础、JDBC 数据库连接操作、I/O 流操作、网络通信、多线程等技术。Java SE 是 Java 平台的基础，用于开发和部署桌面、
阅读更多2024-11-25