使用 Elasticsearch Dump 工具进行生产环境到测试环境的数据迁移与备份

🕗 发布于 2024-10-12 09:44 elasticsearch jenkins 大数据

es-dump 是 Elasticsearch 的一个实用工具，专门用于从 Elasticsearch 集群中导出或导入数据，支持数据、映射、别名、模板等多种类型的数据操作。它在数据迁移、备份、恢复等场景中非常实用。本文将展示如何使用 es-dump 工具执行生产到测试环境的索引复制，以及备份数据到本地文件或云存储服务中。

1. 复制索引从生产到测试环境

在某些情况下，我们需要将生产环境中的 Elasticsearch 索引迁移到测试环境。可以通过以下步骤将生产环境中的分析器、映射和数据导出并导入到测试环境中。

导出并导入分析器：

elasticdump \
  --input=http://production.es.com:9200/my_index \
  --output=http://staging.es.com:9200/my_index \
  --type=analyzer

导出并导入映射：

elasticdump \
  --input=http://production.es.com:9200/my_index \
  --output=http://staging.es.com:9200/my_index \
  --type=mapping

导出并导入数据：

elasticdump \
  --input=http://production.es.com:9200/my_index \
  --output=http://staging.es.com:9200/my_index \
  --type=data

通过上述命令，你可以完整地将生产环境的 my_index 复制到测试环境的 my_index 中，包含索引的分析器、映射和数据。

2. 备份索引到文件

在进行索引备份时，可以将索引的映射和数据导出到本地文件中，以便稍后进行恢复。

备份索引映射到 JSON 文件：

elasticdump \
  --input=http://production.es.com:9200/my_index \
  --output=/data/my_index_mapping.json \
  --type=mapping

备份索引数据到 JSON 文件：

elasticdump \
  --input=http://production.es.com:9200/my_index \
  --output=/data/my_index.json \
  --type=data

3. 使用 `gzip` 压缩备份

如果索引数据量较大，建议通过压缩方式来备份数据。以下命令将数据备份到 gzip 压缩文件中：

elasticdump \
  --input=http://production.es.com:9200/my_index \
  --output=$ \
  | gzip > /data/my_index.json.gz

4. 查询数据备份

在某些情况下，你可能只需要备份符合特定查询条件的数据。可以使用 searchBody 参数来指定查询条件：

备份查询结果到文件：

elasticdump \
  --input=http://production.es.com:9200/my_index \
  --output=query.json \
  --searchBody='{"query":{"term":{"username": "admin"}}}'

5. 拆分备份文件

对于大规模索引，可以将数据拆分成多个部分进行备份。使用 fileSize 参数来限制每个文件的大小：

elasticdump \
  --input=http://production.es.com:9200/my_index \
  --output=/data/my_index.json \
  --fileSize=10mb

6. 云存储上的导入导出

有时你可能需要将数据导入或导出到云存储（如 S3 或 Minio）中。elasticdump 也支持这种操作。

从 S3 导入数据到 Elasticsearch：

elasticdump \
  --s3AccessKeyId "${access_key_id}" \
  --s3SecretAccessKey "${access_key_secret}" \
  --input "s3://${bucket_name}/${file_name}.json" \
  --output=http://production.es.com:9200/my_index

将数据从 Elasticsearch 导出到 S3：

elasticdump \
  --s3AccessKeyId "${access_key_id}" \
  --s3SecretAccessKey "${access_key_secret}" \
  --input=http://production.es.com:9200/my_index \
  --output "s3://${bucket_name}/${file_name}.json"

7. 使用 CSV 数据导入 Elasticsearch

你也可以将 CSV 文件中的数据导入到 Elasticsearch 中。以下命令展示了如何处理 CSV 文件的导入：

elasticdump \
  --input "csv:///data/cars.csv" \
  --output=http://production.es.com:9200/my_index \
  --csvSkipRows 1 \
  --csvDelimiter ";"

这里的 --csvSkipRows 参数用于跳过 CSV 文件中的指定行，--csvDelimiter 用于定义 CSV 文件的列分隔符。

elasticdump 提供了强大的导入导出功能，帮助用户轻松地进行数据备份、恢复、索引迁移等操作。无论是将索引从生产环境迁移到测试环境，还是将数据备份到本地文件或云存储中，elasticdump 都能为你提供灵活的解决方案。

通过合理使用这些功能，你可以显著提高 Elasticsearch 集群的维护和管理效率，确保数据的安全性与可用性。

原文地址：https://blog.csdn.net/weixin_38781498/article/details/142867756

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：H3C GRE over IPsec VPN 实验
下一篇：SpringBoot-application.properties配置

STM32—BKP备份寄存器&RTC实时时钟
BKP(Backup Registers)备份寄存器BKP可用于存储用户应用程序数据。当VDD（2.0~3.6V）电源被切断，他们仍然由VBAT(1.8~3.6V)维持供电。当系统在待机模式下被唤醒，
阅读更多2024-10-13
简单认识redis - 9 redis持久机制
在代码中配置（以 Java 为例，使用 Jedis 库）如果在 Java 程序中使用 Jedis 与 Redis 交互，虽然不能直接在 Jedis 中配置 RDB 持久化的核心参数（如save策略等
阅读更多2024-10-13
怎样将pdf转换成ppt？关于几种PDF转PPT的方法介绍
点击后，会弹出一个文件选择窗口，通过浏览电脑的存储路径，准确地找到并选中要转换的 PDF 文件，然后点击 “打开” 按钮，开始上传文件。如果您的 PDF 文件中的文本可以复制，您可以在 PowerPo
阅读更多2024-10-13
CUDA(C)磁态蒙特卡洛和传输矩阵多GPU并行计算分析
1. 使用英伟达GPU、大都会和并行回火算法模拟蒙特卡洛。2. 使用兰佐斯算法计算传输矩阵特征值。3. 使用 Suzuki-Trotter 公式归一化量子无序系统。4. 算法模型特征：多CUDA线程，
阅读更多2024-10-13
概率多维随机变量与分布
已知另一个随机变量或事件的条件下，该随机变量的概率分布：F(x|A)=P(Xx | A)例如：概率密度函数如图，求在X>1的条件下f(x)的条件分布函数解：F(x | X>1) = P(X
阅读更多2024-10-13
新手如何打造抖音矩阵账号,矩阵账号的优势有哪些?如何搭建矩阵系统的源码开发oem部署
7. 短视频的发布流程通过上述功能的配合使用，不仅能够有效提升内容的质量和多样性，还能确保视频发布的及时性和广泛性，从而吸引更多观众的关注和互动。除此之外，集星云推短视频矩阵系统还具备智能分析功能，
阅读更多2024-10-13
计算机专业大一课程：线性代数探秘
线性代数作为计算机专业的基础课程，对于理解计算机科学的许多领域至关重要。掌握线性代数，不仅能够帮助我们在学术上取得进步，更能在未来的职业生涯中发挥重要作用。所以，让我们一起努力学习线性代数，为计算机科
阅读更多2024-10-13
git merge啥意思
git merge是 Git 中的一个命令，用于将一个分支的更改合并到另一个分支中。当你在一个项目中有多个开发人员同时工作，或者你在不同的特性分支上开发新功能时，git merge命令就非常有用。它可
阅读更多2024-10-13
2013年国赛高教杯数学建模D题公共自行车服务系统解题全过程文档及程序
2013年国赛高教杯数学建模D题公共自行车服务系统解题全过程文档及程序
阅读更多2024-10-13
双边滤波平滑锯齿
双边滤波（Bilateral Filtering）是一种图像处理技术，主要用于图像的平滑或去噪，同时保留边缘细节。它结合了空间邻近度（space proximity）和像素值相似度（pixel val
阅读更多2024-10-13