br实现大数据量的tidb机房迁移

🕗 发布于 2024-10-20 12:37 tidb

要进行tidb机房迁移，机房在不同的洲，网络延迟较高，需要新建集群导数据迁移。因此使用br迁移。

1、数据量有8张表。有2张大表，有接近6T数据。其余6张表共有1T数据。

2、网络带宽每秒传输数据30M 每秒。

首先使用这个sql统计每张表大小。

select table_schema,table_name,TABLE_SIZE/1000 from INFORMATION_SCHEMA.TABLE_STORAGE_STATS where table_schema='库名' and table_name='表名';

最后，尝试了多种方案，迁移数据速度都太慢了，想要实现一天迁移完成数据，

形成了2种比较快的方案配合实现了迁移。

1、6张表共有1T数据用dumpling和lightning迁移数据。

2、2张大表共有6T数据用BR进行数据迁移。

安装软件

使用这个命令安装：

TiDB 工具下载 | PingCAP 归档文档站

wget "https://download.pingcap.org/tidb-toolkit-{version}-linux-amd64.tar.gz"

wget "https://download.pingcap.org/tidb-toolkit-v5.0.3-linux-amd64.tar.gz"

一、用dumpling和lightning迁移数据

1、在原机房dumpling导出数据：

./dumpling -uroot -P 4000 -p 'jinfan' -h 10.31.1.1 --filetype sql -t 8 -o /data1/tidb_backupdata/ -r 10000000 -F 256MiB -B ff_test -T ff_test.
test01,ff_test.test02

备注：按表导出时，表名用逗号隔开。

2、传输数据

压缩：

压缩的线程30，对cpu消耗比较大。

tar -cf - tidb_backupdata | pigz -p 30 > tidb_backupdata.tar.gz

传输

解压：

解压线程30，对cpu消耗比较大。

pigz -p 30 -d tidb_backupdata.tar.gz

tar -xf tidb_backupdata.tar.gz

3、在新机房导入数据：

配置：

[lightning]

# 转换数据的并发数，默认为逻辑 CPU 数量，不需要配置。
# 混合部署的情况下可以配置为逻辑 CPU 的 75% 大小。
# region-concurrency =

# 日志
level = "info"
file = "tidb-lightning.log"

[tikv-importer]
# backend 设置为 tidb 模式
backend = "tidb"

[mydumper]
# 源数据目录。
data-source-dir = "/data3/tidb_backupdata/"

[tidb]
# 目标集群的信息。tidb-server 的监听地址，填一个即可。
host = "10.31.40.59"
port = 4004
user = "root"
password = "xxxxxxxxx"
# 表架构信息在从 TiDB 的“状态端口”获取。
status-port = 10083
# pd-server 的地址，填一个即可
pd-addr = "10.31.40.32:2385"

二、用br迁移数据

br恢复数据报错：

ERROR] [restore.go:35] ["failed to restore"] [error="No such file or directory (os error 2): [BR:KV:ErrKVDownloadFailed]download sst failed; No such file or directory (os error 2): [BR:KV:ErrKVDownloadFailed]download sst failed; No such file or directory (os error 2):

上面的报错原因，就是恢复原理没有搞清楚，在恢复时，需要在本地读取数据，因此恢复数据时也要挂载。

1 使用br迁移导出数据时，需要进行nfs挂载到老集群所有的tikv节点；

2 使用br迁移导入数据时，需要进行nfs挂载到新集群所有的tikv节点。

需要指出的是：

1 、br导出的数据是单副本的数据，因此数据量是1/3

2、br导出的数据是压缩后的数据，因此数据量是很小。

因此：br导出的数据不需要很大的磁盘，但是iops需要很高，需要ssd磁盘。

1、在原机房nfs挂载

1、server端安装

yum -y install nfs-utils rpcbind

2、编辑配置文件

vim /etc/exports 写入如下内容 /data/nfs 10.111.111.0/23(rw,sync,no_root_squash) #/data/nfs 为共享目录 #ip地址是共享的范围

3.再次修改后，执行exportfs -rv 让配置立即生效

启动server端，启动顺序是rpcbind->nfs：

systemctl start rpcbind.service

systemctl enable rpcbind.service

systemctl start nfs.service

systemctl enable nfs.service

4.查看挂载：

showmount -e server_ip

client 安装

yum install -y nfs-utils rpcbind

启动client

systemctl start rpcbind

systemctl enable rpcbind

挂载

直接（临时）挂载

mkdir /remote

mount -o rw -t nfs 10.111.111.111:/data1/nfs /remote

永久挂载（重启后自动挂载）

vim /etc/fstab

写入如下内容： 10.240.82.190:/data1/nfs /remote nfs defaults,_netdev 0 0

加载fstab配置立即生效生效

mount -a

注意：nfs挂载，server和client 用tidb用户导出数据，但是tidb用户在server和client 端，uid和gid可能不一致，导致client没有写入的权限，导致报错。因此解决方案，给server和client端的挂载目录都要给777的权限。

2.使用br导出数据。

./br backup table \
--pd "10.21.17.35:2379" \
--db ff_test \
--table ff_test.test01 \
--storage "local:///remote/milktea_tidb/$cur_date" \
--ratelimit 60 \
--check-requirements=false \
--log-file ${bak_dir}/backup_log/${cur_date}_backuptable.log

备注：--ratelimit 60限制速度，可以减少对原实例影响。

3、压缩传输解压，参考上面

4、恢复数据

./br restore table \
--pd "10.31.40.32:2385" \
--db "ff_test" \
--table "test01" \
--storage "local:///remote/test_tidb/20241017" \
--log-file restorefull.log

注意：如果是空库，不要限制速度，--ratelimit 128 。这个速度是每个tikv的恢复速度，因此，不限制的话，速度很快，达到了节约时间的目的。

原文地址：https://blog.csdn.net/u012565458/article/details/143080400

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：【C语言】strncat、strncmp、strstr函数讲解
下一篇：把其他.ui文件拿到我的工程中使用

leetcode289:生命游戏
根据，简称为，是英国数学家约翰·何顿·康威在 1970 年发明的细胞自动机。给定一个包含m × n个格子的面板，每一个格子都可以看成是一个细胞。每个细胞都具有一个初始状态：1即为（live），或0即为
阅读更多2024-10-20
MongoDB数据恢复
注意：两个MongoDB的版本要一致，本文使用的是mongo:4.2.24。先把K8S上面的MongoDB 容器停止（可以把副本改成0）。1、将容器挂载MongoDB的数据目录备份到本地。经常是数据文
阅读更多2024-10-20
C#中实现事务
C#中实现事务
阅读更多2024-10-20
【LeetCode每日一题】——560.和为 K 的子数组
给你一个整数数组 nums 和一个整数 k ，请你统计并返回该数组中和为 k 的子数组的个数。子数组是数组中元素的连续非空序列。
阅读更多2024-10-20
「漏洞复现」满客宝智慧食堂系统 selectUserByOrgId 未授权访问漏洞
请勿利用文章内的相关技术从事非法测试，由于传播、利用此文所提供的信息而造成的任何直接或者间接的后果及损失，均由使用者本人负责，作者不为此承担任何责任。工具来自网络，安全性自测，如有侵权请联系删除。本次
阅读更多2024-10-20
React面试题目（从基本到高级）
React前端面试常见题目涵盖了React的基础概念、组件、状态管理、生命周期、性能优化等多个方面。
阅读更多2024-10-20
12.个人博客系统（Java项目基于spring和vue）
1 在校学习的学生，可用于日常学习使用或是毕业设计使用 2 毕业一到两年的开发人员，用于锻炼自己的独立功能模块设计能力，增强代码编写能力。 3 亦可以部署为商化项目使用。 4 需要完整资料及源码
阅读更多2024-10-20
YoloV8改进策略：注意力改进|DeBiFormer，可变形双级路由注意力|引入DeBiLevelRoutingAttention注意力模块（全网首发）
本次改进的核心在于将DeBiLevelRoutingAttention模块嵌入到YoloV8的主干网络中，具体位置是在SPPF（Spatial Pyramid Pooling Fast）模块之后。这一
阅读更多2024-10-20
word取消自动单词首字母大写
情况说明：在word输入单词后首字母会自动变成大写取消单词首字母大写步骤：（1）点击菜单栏文件（2）点击“更多”——>“选项”（3）点击“校对”——>“自动更正选项”（4）取消“句首字母大
阅读更多2024-10-20
web前端网页用户注册页面
【代码】web前端网页用户注册页面。
阅读更多2024-10-20

br实现大数据量的tidb机房迁移

相关文章