GaussDB分布式数据倾斜处理

🕗 发布于 2025-01-16 05:13 gaussdb

常规数据倾斜巡检
在库中表个数少于1W的场景，直接使用倾斜视图查询当前库内所有表的数据倾斜情况
SELECT * FROM pgxc_get_table_skewness ORDER BY totalsize DESC;

在库中表个数非常多（至少大于1W）的场景，因PGXC_GET_TABLE_SKEWNESS涉及全库查并计算非常全面的倾斜字段，所以可能会花费比较长的时间（小时级），请根据PGXC_GET_TABLE_SKEWNESS视图定义，直接使用table_distribution()函数自定义输出，减少输出列进行计算优化，例如

SELECT schemaname,tablename,max(dnsize) AS maxsize, min(dnsize) AS minsize 
FROM pg_catalog.pg_class c 
INNER JOIN pg_catalog.pg_namespace n ON n.oid = c.relnamespace 
INNER JOIN pg_catalog.table_distribution() s ON s.schemaname = n.nspname AND s.tablename = c.relname 
INNER JOIN pg_catalog.pgxc_class x ON c.oid = x.pcrelid AND x.pclocatortype = 'H' 
GROUP BY schemaname,tablename;

建议：
分布健选择：

字段的值尽量离散；
选择分布健唯一键；
根据业务场景选择多的字段作为分布健。

原文地址：https://blog.csdn.net/qq_42869878/article/details/145083126

免责声明：本站文章内容转载自网络资源，如侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：使用DAS的导出和导入功能迁移GaussDB数据
下一篇：Django Admin中使用上下文处理器实现用户组权限控制

蓝桥杯R格式--高精度算法模拟
【代码】蓝桥杯R格式--高精度算法模拟。
阅读更多2025-01-21
2025年01月20日Github流行趋势
项目维护者：eclectic-coding,jakeherp,evanplaice,eclecticCodingND,Easybuoy。项目维护者：kamaljohnson,ssiyad,Ritvik
阅读更多2025-01-21
2025美赛Latex模板可直接运行！O奖自用版
2025年美赛Latex模板自用版，O奖优秀论文的Latex模板!
阅读更多2025-01-21
# [0114] Task01 《数学建模导论》P1 解析几何与方程模型
几何语言：∵。
阅读更多2025-01-21
Linux：常用命令--文件与目录操作
每一个用户在Linux系统（典型的多用户操作系统）中都有自己的专属工作目录，称之为HOME目录。功能：用于修改文件或者目录的时间属性，包括存取时间和更改时间。，表示当前工作目录内的test文件夹内的a
阅读更多2025-01-21
Vue2：el-tree用scope slot为每一个节点添加一个鼠标悬浮时出现的右对齐的按钮
el-tree中，每一个节点后面添加一个按钮，响应除节点点击事件之外的操作，要求：1、按钮在鼠标悬浮在该节点之上时才出现2、按钮右对齐实现如下。
阅读更多2025-01-21
第五篇 vue3 ref 与 reactive 对比
注意点： ref 不能写越过 value. 必须要在valeu 前面进行定义。若需要一个响应式对象，且层级较深，推荐使用。若需要一个基本类型的响应式数据，必须使用。通过 ref 来修改整体的名称
阅读更多2025-01-21
WebSocket 和 Socket 的区别
综上所述，Socket提供了更底层的网络通信接口，适用于需要对网络细节有深入控制的场景；而WebSocket则更适用于现代Web应用程序中需要双向通信的场景，它在开发效率和性能上具有优势，特别是在需要
阅读更多2025-01-21
gather算子的CUDA编程和算子测试
知乎介绍参考添加链接描述完整测试框架参考本人仓库添加链接描述gather算子的onnx定义参考添加链接描述，该算子的主要变换参考下图：这里我们不妨以input = [A, dimsize, D]， i
阅读更多2025-01-21
MySQL指定表使用的存储引擎
MySQL指定表使用的存储引擎
阅读更多2025-01-21

GaussDB分布式数据倾斜处理

相关文章