自学内容网 自学内容网

spark connector部分更新写starrocks 出现磁盘暴涨

问题描述:

对starrocks中的主键模型表中的亿级大表中的部分字段进行更新操作,但是更新过程中发现sr集群磁盘出现暴涨,直接导致其他业务数据写入报错。

基础信息:

spark: 3.3.2
starrocks: 3.2
更新字段数:5列+4亿行
数据量:4G

spark 写入配置

put("starrocks.write.properties.partial_update", xxx);
put("starrocks.write.properties.partial_update_mode", "column");
put("starrocks.columns", xxx);

dataset.write()
.format("starrocks")
                .options(option)
                .mode("append")
                .save();

观察sr监控出现磁盘暴涨

550G --> 600G --> 800G -->1.2T

解决方案:

增加写入配置

put("write.mode", "upsert")

原文地址:https://blog.csdn.net/qq_40839450/article/details/144451618

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!