大数据-169 Elasticsearch 索引使用与架构概念增删改查

🕗 发布于 2024-10-15 15:01 大数据 elasticsearch 架构 clickhouse 搜索引擎

点一下关注吧！！！非常感谢！！持续更新！！！

目前已经更新到了：

Hadoop（已更完）
HDFS（已更完）
MapReduce（已更完）
Hive（已更完）
Flume（已更完）
Sqoop（已更完）
Zookeeper（已更完）
HBase（已更完）
Redis （已更完）
Kafka（已更完）
Spark（已更完）
Flink（已更完）
ClickHouse（已更完）
Kudu（已更完）
Druid（已更完）
Kylin（已更完）
Elasticsearch（正在更新…）

章节内容

上节我们完成了如下的内容：

Elasticsearch 的单机配置详细流程

在这里插入图片描述

ES简单使用

创建索引

创建 wzk_blog01 索引

http://h121.wzk.icu:9200/wzk_blog01/?pertty

返回结果如下：

{
  "acknowledged": true,
  "shards_acknowledged": true,
  "index": "wzk_blog01"
}

对应的截图如下图所示：

插入文档

http://h121.wzk.icu:9200/wzk_blog01/_doc/1?pretty
{"id": "1", "title": "What is lucene"}

https://h121.wzk.icu:9200/wzk_blog01/_doc/1?pretty
{"id": "1", "title": "What is wzk icu"}

https://h121.wzk.icu:9200/wzk_blog01/_doc/1?pretty 
{"id": "1", "title": "Apache Spark is a unified analytics engine for large-scale data processing"}

返回结果如下：

{
    "_index": "wzk_blog01",
    "_id": "1",
    "_version": 1,
    "result": "created",
    "_shards": {
        "total": 2,
        "successful": 1,
        "failed": 0
    },
    "_seq_no": 0,
    "_primary_term": 1
}

查询文档

http://h121.wzk.icu:9200/wzk_blog01/_doc/_search/1?pretty

返回结果如下：

{
  "_index": "wzk_blog01",
  "_id": "1",
  "_version": 3,
  "_seq_no": 2,
  "_primary_term": 1,
  "found": true,
  "_source": {
    "id": "1",
    "title": "Apache Spark is a unified analytics engine for large-scale data processing"
  }
}

对应截图如下：
在这里插入图片描述

更新文档

http://h121.wzk.icu:9200/wzk_blog01/_doc/1?pretty
{"id": "1", "title": " What is elasticsearch"}

返回结果如下：

{
  "_index": "wzk_blog01",
  "_id": "1",
  "_version": 4,
  "result": "updated",
  "_shards": {
    "total": 2,
    "successful": 1,
    "failed": 0
  },
  "_seq_no": 3,
  "_primary_term": 1
}

对应截图如下：
在这里插入图片描述

搜索文档

http://h121.wzk.icu:9200/wzk_blog01/_doc/_search?pretty

返回结果如下：

{
  "query": {
    "match": {
      "title": "What"
    }
  }
}

对应截图如下：
在这里插入图片描述

架构与概念

基本简介

Elasticsearch是面向文档的（document oriented）的，这意味着它可以存储整个对象或者文档（document）。然后它不仅仅是存储，还会索引（Index）每个文档的内容使之可以被搜索。在Elasticsearch中，你可以对文档（而非成行成列的数据）进行索引、搜索、排序、过滤。
Elasticsearch是基于Lucene的全文检索引擎，本质也会存储和检索数据，ES中有很多概念与MySQL概念类型，可以按照关系型的数据库的经验去理解。

索引（Index）：类似的数据放在一个索引，非类似的数据放不同索引，一个索引也可以理解成一个关系型数据
类型（type）：代表document属于index中的哪个类别（type）也有一种说法一种type就像是数据库的表，比如dept表，user表。需要注意的是，ES每个大版本之间差别很大。
映射（mapping）：mapping定义了每个字段的类型等信息，相当于关系型数据库中的表结构，常见的数据类型 text、keyword、number、array、range、boolean、date、geo_point、ip 等等类型

Elasticsearch对比传统关系行数据库如下：
在这里插入图片描述

核心概念

索引Index

一个索引就是一个拥有几分相似特征的文档的集合，比如说，你可以有一个客户数据的索引，另一个产品目录的索引，还有一个订单数据的索引，一个索引由一个名字来标识（必须全部都是小写字母），并且当我们要对对应于这个索引中的文档进行索引、搜索、更新和删除的时候，都要使用这个名字，在一个集群中，可以定义任意多的索引。

类型Type

在一个索引中，你可以定义一种或多种类型，一个类型是你的索引的一个逻辑上的分类/分区，其语义完全由你来定。通常，会为具有一组共同字段的文档定义一个类型，比如说，我们假设你运营一个博客平台并且将你所有的数据存储到一个引擎中，在这个索引中，你可以为用户数据定义一个类型，为博客数据定义另一个类型，当然，也可以为评论数据定义另一个类型。当然，也可以为评论数据定义另一个类型。
高版本ES中逐渐抛弃了Type的概念，会有一个默认的 type:doc。

字段Field

相当于是数据表的字段，对文档根据不同属性的进行的分类标识

映射mapping

mapping是处理数据的方式和规则方面做一些限制，如某个字段的数据类型、默认值、分析器、是否被索引等等，这些都是映射里面可以设置的，其他就是处理ES里面数据的一些使用规则设置也叫映射，按着最优规则处理数据对性能提高很大，因为才需要建立映射，并且需要思考如何建立映射才能对性能更好。

文档 document

一个文档是一个可被索引的基础信息单元。比如，你可以拥有某一个客户的文档，某一个产品的一个文档，当然，也可以拥有某个订单的一个文档。文档以JSON（JavaScript Object Notation）格式来表示，而JSON是一个到处存在的互联网数据交互格式。
在一个Index/type里面，你可以存储任意多的文档。注意，尽管一个文档，物理上存在一个索引之中，文档必须被索引/赋予一个索引的type。

近实时NRT

Elasticsearch是一个接近实时的搜索平台，这意味着，这索引锁一个文档直到这个文档能够被搜索到有一个轻微的延迟（通常是1秒以内）

Cluster

集群（Cluster）一个Elasticsearch集群由多个节点（Node）组成，每个集群都有一个共同的集群名称作为标识。
节点（Node）：一个Elasticsearch实例就是一个Node，一台机器可以有多个实例，正常使用下每个实例都应该会部署在不同的机器上，Elasticsearch的配置文件中可以通过node.master node.data来设置节点类型
node.master 表示节点是否具有成为主节点的资格，true代表的有有资格竞选主节点，false代表的是没有资源竞选主节点
node.data 表示节点是否存储数据
Node节点组合：主节点+数据节点（Master+Data），即有成为主节点的资格，又存储数据

node.master: true
node.data: true

数据节点（data）：
节点没有成为主节点的资格，不参与选举，只会存储数据：

node.master: false
node.data: true

客户端节点（client）：
不会成为主节点，也不会存储数据，主要是针对海量请求的时候可以进行负载均衡：

node.master: false
node.data: false

分片：每个索引由一个或者多个分片，每个分片存储不同的数据，分片可以主分片（primary shard）和复制分片（replica shard），复制分片是主分片的拷贝，默认每个主分片有一个复制分片，每个索引的复制分片的数量可以动态的调整，复制分片从不与它的主分片在同一个节点上。
副本：这里指主分片的副本分片（主分片的拷贝）。提高恢复能力，当主分片挂掉的时候，某个复制分片可以变成主分片。提高性能，get和search请求既可以由主分片又可以由复制分片处理

注意：每个索引可以被分成多个分片，一个索引页可以被复制0次（意思是没有复制）或多次，一旦复制了，每个索引有了主分片（作为复制源的原来的分片）和复制分片（主分片的拷贝）之别。分片和复制的数量可以在索引创建的时候指定。在索引创建之后，你可以在任何时候动态的改变复制的数量，但你事后不能改变分片的数量。
默认情况下，Elasticsearch中的每个索引被分片5个和1个复制，这意味着，如果你的集群中至少有两个节点，你的索引将会有5个主分片和另外5个复制分片（1个完全拷贝），这样的话每个索引总共10个分片。

原文地址：https://blog.csdn.net/w776341482/article/details/142908807

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：记录一次hiveserver2卡死(假死)问题
下一篇：抖音视频制作怎么暂停画面,抖音视频怎么让它有暂停的效果

特斯拉智驾路线影响国内OEM组织架构变革，Robotaxi重塑汽车定位搅动风云
其实对于这样的产品推出的时间线我们还是比较乐观的，我们期望很快能够实现完全的无人监督FSD，明年在德州和加州，我们希望推出完全的无人监督的FSD，很明显，Model 3和Model Y是沿着这样的道路
阅读更多2024-10-15
OpeneBayes 教程上新 | 打败 GPT-4V？超强开源多模态大模型 LLaVA-OneVision 正式上线！
视频还包括对运动员脸部的特写，展示了他们的专注和决心。近期，来自字节跳动、南洋理工大学、香港中文大学和香港科技大学的研究人员共同开源了 LLaVA-OneVision 多模态大模型，该模型在单图像、多
阅读更多2024-10-15
Windows server 2019的安装
图1-2 在有空间的磁盘上创建一个目录用于指定安装Windows server 2019。图1-8 安装完毕后重启，目前是在安装VMware tools虚拟工具。图1-3 给虚拟机命名/改名,将安装的
阅读更多2024-10-15
nacos使用需注意的问题
spring:cloud:nacos:#config:discovery:
阅读更多2024-10-15
python 桌面程序开发
功能描述：编写带UI界面的桌面程序，读取终端设备历史轨迹数据，采用多线程高并发，模拟终端设备实时定位发送，检测服务端程序的性能。6.生成的执行文件在dist目录中，需要生成linux、麒麟环境中运行程
阅读更多2024-10-15
Spring Boot 核心理解-自动装配
springBoot重新梳理和学习。为了面试。加油。。。。。
阅读更多2024-10-15
时间序列预测（四）——损失函数（Lossfunction）
在 BCE 的基础上直接对模型输出进行 Sigmoid 操作，适合未经 Sigmoid 的原始输出（logits）。适用场景：二分类任务，适合直接使用模型的输出值（未经过 Sigmoid 激活的 lo
阅读更多2024-10-15
模块化沙箱：构建零信任架构的关键技术
政府机构可以采用零信任结合模块化沙箱的组合，形成一机两用的解决方案，确保业务工作的流畅性和安全性。国企央企和科研企业也可以通过使用模块化反向沙箱和重型沙箱，确保安全上网、数据防泄漏和防病毒，以及研发调
阅读更多2024-10-15
基础篇:带你打开Vue的大门（二）
本文将详细介绍Vue.js中常用的指令和功能，包括条件渲染（v-if、v-else-if、v-else和v-show）、列表渲染（v-for）、属性绑定和事件处理、计算属性和侦听器、Class与Sty
阅读更多2024-10-15
一文读懂何为高内聚低耦合
耦合程度越高，模块之间的依赖性越强，意味着更改一个模块时可能会带来连锁反应，影响到其他模块的功能和行为。为了实现高内聚、低耦合，每个子任务都可以封装在独立的模块中，彼此之间通过接口进行通信，避免模块之
阅读更多2024-10-15

大数据-169 Elasticsearch 索引使用 与 架构概念 增删改查

点一下关注吧！！！非常感谢！！持续更新！！！

目前已经更新到了：

章节内容

ES简单使用

创建索引

插入文档

查询文档

更新文档

搜索文档

架构与概念

基本简介

核心概念

索引Index

类型Type

字段Field

映射mapping

文档 document

近实时NRT

Cluster

相关文章

大数据-169 Elasticsearch 索引使用与架构概念增删改查