大数据-173 Elasticsearch 索引操作增删改查详细 JSON 操作

🕗 发布于 2024-10-19 17:35 大数据 elasticsearch json 全文检索搜索引擎

点一下关注吧！！！非常感谢！！持续更新！！！

目前已经更新到了：

Hadoop（已更完）
HDFS（已更完）
MapReduce（已更完）
Hive（已更完）
Flume（已更完）
Sqoop（已更完）
Zookeeper（已更完）
HBase（已更完）
Redis （已更完）
Kafka（已更完）
Spark（已更完）
Flink（已更完）
ClickHouse（已更完）
Kudu（已更完）
Druid（已更完）
Kylin（已更完）
Elasticsearch（正在更新…）

章节内容

上节我们完成了如下的内容：

Elasticsearch 索引操作
IK 分词器安装上使用
自定义分词

在这里插入图片描述

映射操作

索引创建之后，等于有了关系型数据库中的Database，Elasticsearch7.x取消了索引type类型的设置，不允许指定类型，默认为_doc，但字段仍然是有的，我们需要设置字段的约束信息，叫做字段映射（mapping）
字段的约束包括但不限于：

字段的数据类型
是否要存储
是否要索引
分词器

创建映射字段

语法：

PUT /索引名/_mapping
{
  "properties": {
    "字段名": {
      "type": "数据类型",
      "index": true,
      "store": false,
      "analyzer": "分词器"
    }
  }
}

上述内容解释如下：

type 类型，可以是 text、long、short、date等等
index 是否为索引默认为true
store 是否存储默认为false
analyzer 分词器

示例：

# 新建索引
PUT /wzkicu-index
# 映射关系
PUT /wzkicu-index/_mapping/
{
  "properties": {
    "name": {
      "type": "text",
      "analyzer": "ik_max_word"
    },
    "job": {
      "type": "text",
      "analyzer": "ik_max_word"
    },
    "logo": {
      "type": "keyword",
      "index": "false"
    },
    "payment": {
      "type": "float"
    }
  }
}

运行结果如下图所示：
在这里插入图片描述
上图中，包含的字段如下所示，并且加了一些属性：

name 企业名称
job 需求岗位
logo logo图片地址
payment 薪资

映射属性详解

支持的类型非常的多，可以访问对应的文档进行查看：

https://www.elastic.co/guide/en/elasticsearch/reference/8.15/mapping-types.html

对应的页面如下图所示：
在这里插入图片描述
这里有几种：

String类型：text可分词，不可参与聚合。keyword不可分词，作为完整字段进行分配，可以参与聚合。
Numerical类型：数值类型、分两类，基本数据类型、浮点数的高精度类型
Date：日期类型，ES可以对日期格式化字符串存储，但是建议我们存储为毫秒值、存储为long、节省空间。
Array 数组类型，进行匹配时，任意一个元素满足，都认为满足。排序时，如果升序则用数组中最小值来排序，如果降序则用数组中的最大值来排序
Object对象，{ name: “jack”, age: 21, girl: {name: “Rose”, age: 21}}，如果存储到索引库是对象类型，例如上面的girl，会把girl变成girl.name和girl.age
index，true字段会被索引，则可以用来进行搜索，默认值就是true。false字段不会被索引，不能用来搜索。比如LOGO的图片地址，这种不需要索引，就可以设置为False。
store，是否将数据进行独立存储，原始的文本存储在 _source里面，默认情况下其他提取出来的字段都不是独立存储的，是从_source里面提取出来的。当然你也可以独立的存储某个字段，只要设置store:true即可，获取独立存储的字段要比_source中解析快得多，但是也会占用更多的空间，所以要根据实际业务需要来设置，默认为false
analyzer：指定分词器一般使用IK分词器 ik_max_word ik_smart

查看映射关系

单个映射关系
语法：

GET /索引名称/_mapping

示例：

GET /wzkicu-index/_mapping

执行的结果如下图所示：
在这里插入图片描述

所有映射关系

语法：

GET _mapping
GET _all/_mapping

执行结果如下图所示：
在这里插入图片描述

修改映射关系

PUT /索引库名/_mapping
{
  "properties": {
    "字段名": {
      "type": "类型",
      "index": true,
      "store": true,
      "analyzer": "分词器"
    }
  }
}

主要注意的是：修改映射只能是增加字段的操作，其他的更改只能删除索引重新建立索引来实现。

一次性建立索引与映射

实际上创建索引和映射是可以放到一起来做的，在创建索引的同时，直接指定映射。

PUT /索引库名称
{
  "settings":{
    "索引库属性名":"索引库属性值"
  },
  "mappings":{
    "properties":{
      "字段名":{
        "映射属性名":"映射属性值"
      }
    }
  }
}

案例：

PUT /wzk-index
{
  "settings": {},
  "mappings": {
    "properties": {
      "name": {
        "type": "text",
        "analyzer": "ik_max_word"
      }
    }
  }
}

执行结果如下图所示：
在这里插入图片描述

文档增删改查与局部更新

文档，即索引库中的数据，会根据规则创建索引，将用来搜索，可以类比做数据库中的一行数据。

新增文档

新增文档时，涉及到的ID的创建方式，手动指定或者自动生成。

手动新增

POST /索引名称/_doc/{id}

示例：

POST /wzkicu-index/_doc/1
{"name" : "百度",
  "job" : "小度用户运营经理",
  "payment" : "30000",
  "logo" : "https://profile-avatar.csdnimg.cn/755ff10be62f4e7081bc36028fa9eafe_w776341482.jpg!1"
}

POST /wzkicu-index/_doc/2
{"name" : "百度",
  "job" : " 百度用户运营经理",
  "payment" : "50000",
  "logo" : "https://profile-avatar.csdnimg.cn/755ff10be62f4e7081bc36028fa9eafe_w776341482.jpg!1"
}

执行的结果如下图所示：
在这里插入图片描述

自动新增

语法：

POST /索引名称/_doc
{
  "field": "value"
}

示例：

POST /wzkicu-index/_doc
{
  "name" : "百度",
  "job" : " 百度测试",
  "payment" : "20000",
  "logo" : "https://profile-avatar.csdnimg.cn/755ff10be62f4e7081bc36028fa9eafe_w776341482.jpg!1"
}

执行结果如下图所示：
在这里插入图片描述

查询文档

单个文档

语法：

GET /索引名称/_doc/{id}

示例：

GET /wzkicu-index/_doc/1

执行结果如下图所示：
在这里插入图片描述
对返回的结果的格式解释如下：

所有文档

语法：

 POST /索引名称/_search

示例：

POST /wzkicu-index/_search
{
  "query":{
    "match_all": {
    }
  }
}

测试运行的结果如下图所示：
在这里插入图片描述

定制返回字段

很多业务场景下，我们不需要返回这么多字段：
示例：

GET /wzkicu-index/_doc/1?_source=name,job

执行结果如下图所示，可以看到根据需要，只返回了 name 和 job：
在这里插入图片描述

更新文档

全部更新

新增方式相同，只不过新增是POST，而更新是PUT，而且修改必须指定ID才可以。

id对应的文档存在，则修改
id对应的文档不存在，则新增

PUT /wzkicu-index/_doc/5
{
  "name" : "百度",
  "job" : " 百度测试",
  "payment" : "20000",
  "logo" : "https://profile-avatar.csdnimg.cn/755ff10be62f4e7081bc36028fa9eafe_w776341482.jpg!1"
}

第一次执行，可以看到右侧是：created：
在这里插入图片描述
再执行一次，可以看到右侧是：updated：

局部更新

ES可以使用PUT或者POST进行更新，如果指定ID存在，则执行更新操作。
注意：

ES执行更新操作的时候，ES是先将旧的标记为删除，再添加新的文档。
旧的文档不会立即消失，但是你也无法访问，ES会在添加更多数据的时候，后台清理已经标记为删除的数据。
全部更新是直接把之前的老数据，标记为删除状态，然后再添加一条更新的数据（PUT或者POST），局部更新，只是修改某个字段（POST）。

POST /索引名/_update/{id}
{
  "doc":{
    "field":"value"
  }
}

示例：

POST /wzkicu-index/_update/2
{
  "doc":{
    "name":"淘宝"
  }
}

执行的结果如下图所示：
在这里插入图片描述

删除文档

ID删除
语法：

DELETE /索引名/_doc/{id}

示例

DELETE /wzkicu-index/_doc/3

执行结果如下图所示：
在这里插入图片描述

条件删除

语法：

POST /索引名/_delete_by_query
{
  "query": {
    "match": {
      "字段名": "搜索关键字"
    }
  }
}

示例：

# 查询一下 包含百度关键字的
POST /wzkicu-index/_search
{
  "query":{
    "match":{
      "name":"百度"
    }
  }
}

# 删除name字段为百度的doc
POST /wzkicu-index/_delete_by_query
{
  "query":{
    "match":{
      "name":"百度"
    }
  }
}

执行结果如下图所示：
在这里插入图片描述

删除所有

POST /索引名/_delete_by_query
{
  "query": {
    "match_all": {}
  }
}

原文地址：https://blog.csdn.net/w776341482/article/details/142979618

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Elasticsearch高级搜索技术-全文搜索
下一篇：用 Python 构建高级配对交易策略

【C语言】动态内存管理（上）
本篇博客将讲解以下知识点：（1）为什么要有动态内存分配（2）malloc和free。
阅读更多2024-10-20
Spring Boot里的响应式和Vue里的响应式
Spring Boot 3的响应式编程主要应用于后端，旨在通过异步、非阻塞的方式提高Web应用程序的性能和吞吐量。而Vue 3的响应式系统则主要应用于前端，通过监听数据的变化来自动更新用户界面，提高用
阅读更多2024-10-20
shell脚本部署redis,mysql,elasticsearch
这里用到的包为elasticsearch-6.8.0.tar.gz，elasticsearch-analysis-ik-6.8.0.zip ，elasticsearch-sql-6.8.0.0.zip
阅读更多2024-10-20
机器学习面试笔试知识点-线性回归、逻辑回归(Logistics Regression)和支持向量机(SVM)
机器学习面试笔试知识点-线性回归、逻辑回归(Logistics Regression)和支持向量机(SVM)
阅读更多2024-10-20
第六章元素应用CSS
在学习网页设计时我们通常会用到html对文本字体进行一些非常简单的样式设置。字体样式的常用属性如表1所示。表-1。
阅读更多2024-10-20
【NOIP提高组】一元三次方程求解
有形如：ax3+bx2+cx+d=0 这样的一个一元三次方程。给出该方程中各项的系数(a，b，c，d均为实数)，并约定该方程存在三个不同实根(根的范围在-100至100之间)，且根与根之差的绝对值&
阅读更多2024-10-20
KMP 算法
KMP 算法是一种改进的字符串匹配算法，利用匹配失败后的信息，尽量减少模式串与主串的匹配次数以达到快速匹配的目的。文章介绍了KMP算法为什么不需要在主串中进行回退、如何计算next数组、next数组的
阅读更多2024-10-20
【C++ 算法进阶】算法提升四
数组为 {3 ， 2， 2 ，3 ，1} 查询为（0 ，3 ，2）这个查询的意义是在数组下标0~3这个范围上有多少个2 （答案为2）假设现在给你一个数组arr 假设我们对于这个数组的查询十分频
阅读更多2024-10-20
管家婆财贸ERP BB007.销售订单明细批量采购
ⅱ. 供应商：供应商基本信息列，默认显示供应商全名，用户可以双击选择供应商，显示客户+存货对应匹配的供应商，匹配规则详见后续的供应商匹配规则。ⅳ. 订单编号：超链接文本列，默认显示，不可编辑，显示销售
阅读更多2024-10-20
LabVIEW自动化流动返混实验系统
传统的流动返混实验操作复杂，数据记录和处理不便，基于LabVIEW的全自动流动返混实验系统能自动测定多釜反应器、单釜反应器和管式反应器的停留时间分布，并对其返混程度进行数学评价，大大简化了操作流程，提
阅读更多2024-10-20

大数据-173 Elasticsearch 索引操作 增删改查 详细 JSON 操作

点一下关注吧！！！非常感谢！！持续更新！！！

目前已经更新到了：

章节内容

映射操作

创建映射字段

映射属性详解

查看映射关系

所有映射关系

修改映射关系

一次性建立索引与映射

文档增删改查与局部更新

新增文档

手动新增

自动新增

查询文档

单个文档

所有文档

定制返回字段

更新文档

全部更新

局部更新

删除文档

条件删除

删除所有

相关文章

大数据-173 Elasticsearch 索引操作增删改查详细 JSON 操作