PostgreSQL核心揭秘(三)-元组结构

🕗 发布于 2024-11-08 16:18 postgresql 数据库

概述

2. 堆元组介绍
1）HeapTupleHeaderData 结构
2）空值位图（Null Bitmap）
3）用户数据（User Data）

3. 元组增、删、改操作介绍

1）增（INSERT）操作

2）删（DELETE）操作

3）改（UPDATE）操作

4. 总结

概述
在PostgreSQL中，堆元组（Heap Tuple）是表中一行数据的内部表示。每个堆元组都存储在一个页面（通常为8KB）内，并且由三个主要部分组成：HeapTupleHeaderData 结构、空值位图以及用户数据。

详细介绍

1. HeapTupleHeaderData 结构

HeapTupleHeaderData 是元组头部的数据结构，它包含了关于该元组的一些关键信息。这些信息包括事务相关的数据和一些标志位，用于多版本并发控制（MVCC）。

以下是其主要字段：

田	类型	长度	描述
t_xmin	交易 ID	4 字节	插入 XID 图章
t_xmax	交易 ID	4 字节	删除 XID 图章
t_cid	CommandId	4 字节	插入和/或删除 CID 图章（与 t_xvac 叠加）
t_xvac	交易 ID	4 字节	XID 用于 VACUUM 操作移动行版本
t_ctid	ItemPointerData （项目指针数据）	6 字节	此行版本或更新行版本的当前 TID
t_infomask2	uint16	2 字节	属性数量，以及各种标志位
t_infomask	uint16	2 字节	各种标志位
t_hoff	uint8	1 字节	用户数据的偏移量

2. 空值位图（Null Bitmap）

空值位图是一个可选的部分，仅当表中有允许NULL值的列时存在。这个位图用来标记哪些列的值是NULL。每个位对应一个列，如果某一位被设置，则表示相应的列是NULL。

3. 用户数据（User Data）

用户数据部分包含实际的字段值。这些值按照表定义中列的顺序排列。对于固定长度的数据类型（如int4），直接存储在用户数据部分；对于可变长度的数据类型（如text、varchar），则会有一个长度前缀，随后是实际的数据。

元组增、删、改操作介绍

1. 增（INSERT）操作

假设元组是由 txid=99 的事务插入页面中的，这时被插入元组的首部字段设置如下：

Tuple：

t_xmin：设置为 99，因为此元组由 txid=99 的事务所插入。
t_xmax：设置为 0，因为此元组尚未被删除或更新。
t_cid：设置为 0，因为此元组是由 txid=99 的事务所执行的第一条命令插入的。
t_ctid：设置为 (0,1)，指向自身，因为这是该元组的最新版本。

2. 删（DELETE）操作

假设接下来事务 txid=100 对元组进行了删除操作。此时，删除操作会设置如下：

Tuple（删除后状态）：

t_xmin：保持为 99，表示该元组的插入事务。
t_xmax：设置为 100，因为此元组现在被 txid=100 的事务删除。
t_cid：设置为 0，因为删除操作是由 txid=100 事务的第一条命令执行的。
t_ctid：保持为 (0,1)，仍指向原元组。

死元组最终将从页面中被移除。清除死元组的过程被称为清理（VACUUM）过程

3. 改（UPDATE）操作

如果在 txid=101 的事务中，对该元组进行了更新操作。此时，更新操作会创建一个新的元组，且原元组保持不变。新元组的设置如下：

当执行第一条UPDATE命令时，Tuple_1的t_xmax被设为txid 100，在逻辑上被删除，然后Tuple_2被插入，接下来重写Tuple_1的t_ctid以指向Tuple_2。Tuple_1和Tuple_2的头部字段设置如下。

第一条 UPDATE 命令

逻辑删除 Tuple_1：

Tuple_1 的 t_xmax 被设置为 100（txid）。
Tuple_1 的 t_ctid 从 (0,1) 改写为 (0,2)，指向新插入的元组。

Tuple_1 设置：

t_xmax: 100、 t_ctid: (0,2)

插入新元组 Tuple_2：

Tuple_2 的 t_xmin 被设置为 100（当前事务 txid）。
t_xmax 设置为 0（尚未被删除或更新）。
t_cid 设置为 0（表示这是该事务的第一条操作）。
t_ctid 设置为 (0,2)（指向自身）。

Tuple_2 设置：

t_xmin: 100、t_xmax: 0、t_cid: 0、t_ctid: (0,2)

第二条 UPDATE 命令

逻辑删除 Tuple_2：

Tuple_2 的 t_xmax 被设置为 100（当前事务 txid）。
Tuple_2 的 t_ctid 从 (0,2) 改写为 (0,3)，指向新插入的元组。

Tuple_2 设置：

t_xmax: 100、t_ctid: (0,3)

插入新元组 Tuple_3：

Tuple_3 的 t_xmin 被设置为 100（当前事务 txid）。
t_xmax 设置为 0（尚未被删除或更新）。
t_cid 设置为 1（表示这是该事务的第二条操作）。
t_ctid 设置为 (0,3)（指向自身）。

Tuple_3 设置：

t_xmin: 100、t_xmax: 0、t_cid: 1、t_ctid: (0,3)

与删除操作类似，如果txid=100的事务已经提交，那么Tuple_1和Tuple_2就成了死元组，而如果txid=100的事务中止，Tuple_2和Tuple_3就成了死元组。

总结

在这个过程中，元组的状态变化如下：

插入：新元组的字段由插入事务的 txid 决定。
删除：删除操作更新t_xmax，记录删除事务的txid。
更新：更新操作创建新的元组，新的 t_xmin 表示更新事务，并且t_cid和t_ctid 反映新的版本信息。

公众号内直接回复加群，即可添加微信群。觉得帖子写的不错，点点关注，点点赞，多多转载，请多多支持。

往期帖子汇总：

数据库维护工具：数据迁移、性能监控、数据修复的全面工具汇总

上一篇：PostgreSQL核心揭秘(二)-进程和内存架构
 PostgreSQL核心揭秘(一)：数据库集簇

从零开始学PostgreSQL-工具篇2:碎片回收pg_repack

从零开始学PostgreSQL-工具篇：备份与恢复

从零开始学PostgreSQL (十四)：高级功能

从零开始学PostgreSQL (十三)：并行查询

从零开始学PostgreSQL (十二)：高效批量写入数据库

从零开始学PostgreSQL (十一)：并发控制

从零开始学PostgreSQL (十)：磁盘使用情况

从零开始学PostgreSQL (九)：任务进度报告

从零开始学PostgreSQL (八)：监控数据库动态

从零开始学PostgreSQL (七)：高可用性、负载平衡和复制

从零开始学PostgreSQL (六)：备份和恢复

从零开始学PostgreSQL (五)：日常数据库维护任务

从零开始学PostgreSQL (四)：数据库角色

从零开始学PostgreSQL (三)：索引篇

从零开始学PostgreSQL (二)：配置文件

从零开始学PostgreSQL (一)：Centos8 RPM安装PostgreSQL16

原文地址：https://blog.csdn.net/qq_34692500/article/details/143545926

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：80后聊架构：架构设计中两个重要指标，延时与吞吐量(Latency vs Throughput) | 架构师之路...
下一篇：「STL::array」标准库容器：array（数组）介绍（C++）

GOLANG笔记第四周
原本的本地函数放到另一个服务器上运行，但是引入了很多新问题Call 的id映射序列化和反序列化网络传输。
阅读更多2024-11-16
redis集群主备模式的快速搭建
redis主备集群可以有效的实现节点的冗余备份，提高redis的负载压力的同时，又有效的实现了故障切换。
阅读更多2024-11-16
Python实现贪吃蛇经典解压小游戏！附源码
大家应该都玩过诺基亚上面的贪吃蛇吧，那是一段美好的童年回忆，本文将带你一步步用python语言实现一个snake小游戏！版本：Python3●系统：Windows●相关模块：pygamepip ins
阅读更多2024-11-16
Unity中HDRP设置抗锯齿
在Unity的高清渲染管线（HDRP）中，Post Anti-Aliasing（后期抗锯齿）提供了几种不同的抗锯齿选项，以减少图像中的锯齿效果并提升视觉质量。FXAA是一种基于像素的抗锯齿方法，通过模
阅读更多2024-11-16
嘎嘎快充php版服务端部署配置注意玉阳软件
6、需要移除PHP禁用函数：proc_open、pcntl_alarm、pcntl_fork、pcntl_wait、pcntl_signal、pcntl_signal_dispatch。7、不需要cd
阅读更多2024-11-16
Docker 容器常见故障排查及处理
Docker 容器常见故障排查及处理。
阅读更多2024-11-16
Python实现人脸识别算法并封装为类库（续）
本文将介绍如何使用Python实现一个人脸识别系统，并将其封装为一个类库。我们将逐步扩展和完善这个类库，增加代码优化、人脸照片存储到数据库、对特殊场景（如戴口罩、眼镜）的优化，以及灵活的识别距离设置。
阅读更多2024-11-16
CentOS虚拟机使用记录
1.安装 Vmtool ,重启后可显示U盘2.安装minicomcentOs 安装使用yum minicom ,没有apt-get 命令通过ssh网口root 2440ssh root@192.16
阅读更多2024-11-16
MATLAB中的绘图技巧
综上所述，MATLAB凭借其强大的绘图功能，为用户提供了丰富多样的可视化选择。从基础的二维图形到复杂的三维动画，MATLAB都能够胜任。掌握这些绘图技巧，不仅能够提升数据分析的可读性，也能够增强报告和
阅读更多2024-11-16
Win11 终端执行 python xxx.py 没反应
在 Win11 上写了一段 Python 代码来分析日志文件，发现执行没反应。是在 VSCode 里的终端中执行的。, 是 PowerShell；也尝试了 cmd，情况一样。WindowsApps
阅读更多2024-11-16

PostgreSQL核心揭秘(三)-元组结构

相关文章