大数据-150 Apache Druid 安装部署单机启动系统架构

🕗 发布于 2024-09-28 07:05 大数据 apache 系统架构 clickhouse java

点一下关注吧！！！非常感谢！！持续更新！！！

目前已经更新到了：

Hadoop（已更完）
HDFS（已更完）
MapReduce（已更完）
Hive（已更完）
Flume（已更完）
Sqoop（已更完）
Zookeeper（已更完）
HBase（已更完）
Redis （已更完）
Kafka（已更完）
Spark（已更完）
Flink（已更完）
ClickHouse（已更完）
Kudu（已更完）
Druid（正在更新…）

章节内容

上节我们完成了如下的内容：

Apache Druid 基本介绍
Apache Druid 技术特点
Apache Druid 应用场景

在这里插入图片描述

系统架构

Apache Druid 是一个高性能的实时分析数据库，专为快速聚合和查询大规模数据集而设计。它的架构由多个组件组成，每个组件在数据的存储、处理和查询中发挥重要作用。

（部分内容上节已经有了）

核心组件

数据摄取层 (Ingestion Layer)

数据源: Druid 支持多种数据源，如 Kafka、HDFS、Amazon S3 等。数据摄取可以是批处理（Batch）或实时流处理（Streaming）。
任务管理: 使用任务协调器来管理数据摄取任务，确保数据流的顺畅和高可用性。

数据存储层 (Storage Layer)

Segment: Druid 将数据分为多个小块，称为“段”（Segment）。每个段通常包含一段时间内的数据，并被优化以支持快速查询。
时间分区: Druid 根据时间将数据分区，以提高查询性能。数据按时间戳索引，有助于高效的时间范围查询。

查询层 (Query Layer)

Broker: 负责接收用户的查询请求并将其路由到相应的数据节点（如历史节点和实时节点）。
查询执行: Druid 支持多种查询类型，包括聚合查询、过滤查询和分组查询。查询结果会通过 Broker 返回给用户。

历史节点 (Historical Node)

存储并管理长时间的数据段，负责处理对历史数据的查询。

实时节点 (Real-time Node)

用于实时摄取数据，实时处理并生成可查询的段。适合需要低延迟数据访问的应用。

协调节点 (Coordinator Node)

负责管理 Druid 集群的各个节点，监控节点的健康状态、数据分布和负载均衡。

数据流动

数据摄取: 数据从外部源流入 Druid（如 Kafka 消息队列），经过任务管理和转换后被摄取。
数据存储: 数据被分段并存储在历史节点和实时节点中，按时间分区和压缩以优化存储。
查询处理: 用户通过查询接口（如 SQL 或 Druid 特定的查询语言）发送查询请求，Broker 节点将请求分发到相应的数据节点，聚合和处理查询结果后返回。

查询优化

列式存储: Druid 采用列式存储格式，提高了压缩率和查询性能。
索引: Druid 会为每个字段建立索引，加速过滤和聚合操作。
预聚合: 对常用的聚合操作进行预计算，以减少实时查询的计算负担。

可扩展性与高可用性

Druid 支持横向扩展，可以根据需求添加更多的节点来处理更大的数据集和更高的查询负载。
数据冗余和节点监控机制确保了系统的高可用性。

下载解压

官方目前已经到了版本30了

wget https://dlcdn.apache.org/druid/30.0.0/apache-druid-30.0.0-bin.tar.gz

直接结果如下图所示：
在这里插入图片描述
进行解压：

tar -zxvf apache-druid-30.0.0-bin.tar.gz

执行结果如下图所示：
在这里插入图片描述
移动到目标目录：

mv apache-druid-30.0.0 /opt/servers/
cd /opt/servers/apache-druid-30.0.0
ls

执行结果如下图所示：
在这里插入图片描述

单机部署

配置文件

单服务器部署的配置文件如下：

conf/druid/single-server/
├── large
├── medium
├── micro-quickstart
├── nano-quickstart
├── small
└── xlarge

文件的路径如下图所示：
在这里插入图片描述

启动要求

单服务器的要求如下：

Nano-Quickstart：1个CPU，4GB RAM
启动命令： bin/start-nano-quickstart
配置目录： conf/druid/single-server/nano-quickstart/*
微型快速入门：4个CPU，16GB RAM
启动命令： bin/start-micro-quickstart
配置目录： conf/druid/single-server/micro-quickstart/*
小型：8 CPU，64GB RAM（〜i3.2xlarge）
启动命令： bin/start-small
配置目录： conf/druid/single-server/small/*
中：16 CPU，128GB RAM（〜i3.4xlarge）
启动命令： bin/start-medium
配置目录： conf/druid/single-server/medium/*
大型：32 CPU，256GB RAM（〜i3.8xlarge）
启动命令： bin/start-large
配置目录： conf/druid/single-server/large/*
大型X：64 CPU，512GB RAM（〜i3.16xlarge）
启动命令： bin/start-xlarge
配置目录： conf/druid/single-server/xlarge/*

环境变量

vim /etc/profile

写入如下的内容，记得刷新环境变量:

# druid
export DRUID_HOME=/opt/servers/apache-druid-30.0.0
export PATH=$PATH:$DRUID_HOME/bin

写入内容如下图所示：
在这里插入图片描述
(这里注意，要关闭其他的服务，比如ZK什么的，不然会提示2181端口会占用)

zkServer.sh stop

执行结果如下图所示：
在这里插入图片描述
接着进行启动，启动结果如下图所示：

查看页面

http://h121.wzk.icu:8888/

页面结果显示如下图：
在这里插入图片描述

在这里插入图片描述
PS：官方建议大型系统采用集群模式部署，以此来实现容错和减少资源的争抢。

原文地址：https://blog.csdn.net/w776341482/article/details/142586890

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：设计模式、系统设计 record part02
下一篇：MR30分布式IO模块：革新纸巾包装，引领智能化绿色生产新纪元

PHP 中，将 JSON 数据与二进制数据之间进行相互转化主要涉及两个步骤：
要将 JSON 数据转换为二进制数据，首先需要将 JSON 数据解析成 PHP 数组或对象，然后使用 PHP 的。函数将二进制字符串转换为 PHP 数组或对象，然后将其编码为 JSON 数据。如果你只
阅读更多2024-09-28
JavaEE: 探索网络世界的核心-IP协议
13位分片偏移: 是分片相对于原始IP报文开始处的偏移.其实就是在表示当前分片在原报文中处在哪个位置.实际偏移的字节数是这个值 * 8 得到的.因此,除了最后一个报文之外,其他报文的长度必须是8的整数
阅读更多2024-09-28
数据库常见概念
PostgreSQL 支持联合索引和聚簇索引，联合索引可以加速多列条件的查询，而聚簇索引控制数据在磁盘上的排列。适当地使用这些索引可以提高查询性能。
阅读更多2024-09-28
BEV学习---LSS4-模型训练
LSS训练测试
阅读更多2024-09-28
SpringCloud第六章(服务保护CircuitBreaker) -2024
CircuitBreaker是断路器的意思，由于原来的SpringCoud的hystrix停更，所以springcloud社区推出了的新断路器，用来进行springcloud的服务降级、限流、熔断由于
阅读更多2024-09-28
ubuntu 开启root
【代码】ubuntu 开启root。
阅读更多2024-09-28
MySQL数据查询（基础）
SELECT语句用于从表中查询数据。可以选择特定的列，也可以选择所有列。：使用表示选择所有列。
阅读更多2024-09-28
区块链可投会议CCF C--FC 2025 截止10.8 附录用率
CCF C：2025：2023年 39 full and 2 short papers selected from 182 submissions.
阅读更多2024-09-28
第1章 C语言概述
4.打开项目后，右击"源文件"并选择"添加"的"新建项"6.在"hello_word"文件下编写代码并点击运行。1.打开
阅读更多2024-09-28
Git 与 GUI 工具
当我们对 Git 的提交、分支已经非常熟悉，可以熟练使用命令操作 Git 后，再使用 GUI 工具，就可以更高效。
阅读更多2024-09-28

大数据-150 Apache Druid 安装部署 单机启动 系统架构