百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程字典 > 正文

入门Elasticsearch,我觉着你看这一篇就够了

toyiye 2024-06-21 11:57 12 浏览 0 评论

推荐学习

前言

Elasticsearch 是由 Shay Banon 发起的一个开源的分布式搜索服务,自 2010 年 2 月发布以来,该项目已发展成为搜索和数据分析解决方案领域中极其重要的一员,广泛应用于各大网站。

01 可视化工具

正如关系型数据库一样,我们使用 Elasticsearch 时也需要一款可视化工具,最常用的就是 kibana,而这也是 ELK 组建中的 K,剩下的 L 就是 Logstash。

1.1 kibana

Kibana 是一款非常强大的工具,使用 kibana,我们可以做以下三件事:

  1. 搜索,观察和保护: 从发现文档到分析日志再到发现安全漏洞,Kibana是您访问这些功能及其他功能的门户。
  2. 可视化即数据分析:分析在图表,仪表,地图等发现的数据,并将它们组合到仪表板。
  3. 管理监控即保护 Elastic Stack:管理索引和提取管道,监视Elastic Stack集群的运行状况,并控制哪些用户可以访问哪些功能。

1.2 kibana 的安装

kibana 的安装也比较简单,这里下载对应版本,并进行解压,解压后的主目录即为 $KIBANA_HOME 路径:

同样的,我们需要进入 config 目录下,修改 kibana 的配置文件 kibana.yml。

kibana 配置

和 Elasticsearch 一样,安装好 kibana 之后,我们也需要对其中一些重要的配置文件进行配置:

  • elasticsearch.hosts

配置需要连接的 Elasticsearch 服务,如果配置多个服务,则必须属于同一个 Elasticsearch 集群,默认值为:

elasticsearch.hosts: ["http://localhost:9200"]
  • server.name

标识当前 kibana 的唯一实例,默认是主机名,这个只是起到一个描述标识作用。

  • server.host

指定 kibana 的主机名,默认 localhost,表示只允许本机访问。如果需要远程连接,则需要将此配置修改为外网 ip 地址或者域名等非本地回环地址,或者可以使用 0.0.0.0 允许所有远程主机连接。

  • server.port

配置 kibana 的端口号,默认是 5601。

  • elasticsearch.requestTimeout

等待后台或者等待 Elasticsearch 响应的毫秒数,默认值为:30000.

  • elasticsearch.pingTimeout

等待 Elasticsearch 的 ping 的返回毫秒数,默认值等于 elasticsearch.requestTimeout 配置的时间。

  • elasticsearch.username 和 elasticsearch.password

如果 Elasticsearch 配置了账号密码,则需要在这里配置上账号和密码。

  • path.data

Kibana 中存储没有保存在 Elasticsearch 中的持久化数据的路径。

  • logging.dest

指定 log 路径,默认为 stdout。

  • server.basePath

指定访问 kibana 的基础路径,默认为 /,一般如果要通过 nginx 等中间件进行代理的话,会设置基础路径。

  • server.rewriteBasePath

重定向之后路径是否保留 server.basePath 路径,在 kibana 6.3 及更早的版本默认是 false,在 kibana 7.0 之后的版本中默认为 true。

1.3 kibana 的启动

配置完只要配置文件之后,就可以进入 bin 目录执行命令 ./kibana 启动 kibana,如果想要在后台启动,则可以执行命令 ./kibana &。

启动之后就可以访问 kibana:http://ip:5601/{basePath}

访问之后,打开左边的 Dev Tools,就可以开始执行属于 Elasticsearch 的 “sql 语句” 进行增删改查等操作了:

除了 Dev Tools 之外,kibana 还有许多其他强大的功能,大家可以自行去尝试操作。

02 Elasticsearch 入门操作

经过一系列操作,终于可以开始操作 Elasticsearch 了,Elasticsearch 中的 API 遵循了 REST 风格,利用其提供的 REST API 可以管理索引,更改实例参数,检查节点和集群状态,并且对索引中的文档数据数据进行 CRUD 操作。

2.1 操作 index

索引相当于数据库,所以我们先来学习一下索引的基本操作。

(1)创建 index

创建索引一般使用 PUT 方法:

PUT /my-index-001

如果有定义 mapping,则可以在创建索引的同时带上 mapping:

PUT /my-index-002
{
  "mappings": {
    "properties": {
      "field1": { "type": "text" }
    }
  }
}

同时,创建索引的时候还可以给索引创建别名:

PUT /my-index-003
{
  "mappings": {
    "properties": {
      "field1": { "type": "text" }
    }
  },
  "aliases": {
    "alias_name": {}
  }
}

有了别名之后,查询索引可以使用别名进行查询。

(2)索引别名有什么用

索引别名其实在某些场景的时候是非常有用的,比如当我们上线之后,如果因为某些业务变动,导致需要修改字段,那么这时候在 Elasticsearch 中就需要重建索引。重建索引的时候我们可以指定一个相同的别名,而如果我们的代码中就是通过别名进行查询时,这时候重建索引后就可以实现无缝衔接了。

(3)删除索引

删除索引采用 DELETE 方法。

DELETE /my-index-0001

(4)查询索引

查询索引信息采用 GET 方法,这个可以返回索引的 setting,mapping,aliases 以及分片等信息。

GET /my-index-001

(5)exist 索引

判断索引是否存在,采用的是 HEAD 方法。

HEAD /my-index-001
  • clone index

克隆索引之前,必须要先把一个索引改成只读(同时需保证集群状态为绿色):

PUT /my-index-004/_settings
{
  "settings": {
    "index.blocks.write": true
  }
} 

改成只读后,就可以使用 POST 方法进行克隆索引:

POST /my-index-004/_clone/cloned-my-index-004

2.2 操作 document

学会了 index 的基本操作,接下来就就可以学习一下 document(数据) 的基本操作。

(1)插入 document

插入 document 采用的是 POST 方法:

PUT my-index-001/_create/1
{
  "@timestamp": "2099-11-15T13:12:00",
  "message": "GET /search HTTP/1.1 200 1070000",
  "user": {
    "id": "kimchy"
  }
}

上面的语句中因为没有生成 id,所以 Elasticsearch 会自动生成一个 id 值。

插入指定 id 文档,则可以使用 _resource 语句:

PUT my-index-001/_create/1{  "@timestamp": "2099-11-15T13:12:00",  "message": "GET /search HTTP/1.1 200 1070000",  "user

或者指定 op_type=create:

PUT my-index-001/_doc/2?op_type=create
{
  "@timestamp": "2099-11-15T13:12:00",
  "message": "GET /search HTTP/1.1 200 1070000",
  "user": {
    "id": "kimchy"
  }
}

(2)查询 document

简单的查询语句可以使用 GET 方法:

GET /my-index-001/_search

查询之后得到如下结果(我们的源数据在 hits 里面,外面的字段是 Elasticsearch 自带的通用字段):

如果想只查询特定 id 文档则可以使用如下语句:

GET /my-index-001/_doc/1

而如果我们想指定返回字段或者指定不返回字段,则可以使用 _source 等参数(下面这句话则表示只返回 *.id 的字段且不返回 @timestamp 字段):

GET my-index-001/_doc/1?_source_includes=*.id&_source_excludes=@timestamp

有些有时候如果针对我们自己存储的字段,一个都不想返回,则可以使用如下语句:

GET my-index-001/_doc/1?_source=false

(3)删除 document

删除文档使用 DELETE 方法,删除语法为:DELETE /<index>/_doc/<_id>。

指定 id 删除,超时时间为 5 分钟:

DELETE /my-index-001/_doc/1?timeout=5m

如果想删除所有字段,则可以使用 delete_by_query 语句:

POST my-index-001/_delete_by_query
{
  "query": {
    "match_all": {}
  }
}

同样的,delete_by_query 也可以指定条件删除:

POST /my-index-001/_delete_by_query
{
  "query": {
    "match": {
      "user.id": "elkbee"
    }
  }
}

(4)更新 document

更新 document 一般使用 POST 方法,使用 _update 类型,下面我们来演示一个更新语句:

  • 插入一条数据到 test 索引:
PUT test/_doc/1
{
  "name":"双子孤狼",
  "age":18,
  "address":"广东深圳"
}
  • name 字段进行更新:
POST test/_update/1
{
  "doc": {
    "name": "双子孤狼2"
  }
}
  • 执行查询语句 GET test/_search 进行查询,则发现 name 字段已被更新

使用脚本更新 document

更新语句还可以使用 script 来实现更灵活的操作(如下则表示将 age 字段增加 4):

POST test/_update/1
{
  "script" : {
    "source": "ctx._source.age += params.count",
    "lang": "painless",
    "params" : {
      "count" : 4
    }
  }
}

和 delete_by_query 语句一样,更新语句也可以使用 update_by_query 语句:

POST test/_update_by_query
{
  "script": {
    "source": "ctx._source.age += params.count",
    "lang": "painless",
    "params" : {
      "count" : 4
    }
  },
  "query": {
    "match": {
      "name": "双子孤狼2"
    }
  }
}

03 reindex 操作

有时候我们需要将一个索引的数据复制到另一个索引,那么这时候就可以使用 reindex 操作,这个操作和前面的 clone 操作的区别是 reindex 操作只会迁移文档数据,而不会将 setting,mapping以及分片等信息迁移到新索引,而且在执行 reindex 操作时不需要将旧索引设置为只读状态。

POST _reindex?wait_for_completion=false
{
  "source": {
    "index": "old-index"
  },
  "dest": {
    "index": "new-index"
  }
}

wait_for_completion 参数默认为 true,表示当前操作会一直阻塞直到成功为止,如果到了超时时间还没有完成则会报错,所以如果数据量比较大可以修改 wait_for_completion 参数为 false。

总结

本文主要介绍了 kibana 的安装及一些主要的配置,并通过 kibana 介绍了 Elasticsearch 中对 index 和 document 的一些基本的增删改查操作。当然,如果想要深入使用 Elasticsearch,这些语句是远远不够的,Elasticsearch 的一些高级查询及分析语句才是 Elasticsearch 的核心。

作者:双子孤狼

原文链接:https://blog.csdn.net/zwx900102/article/details/116913832

相关推荐

为何越来越多的编程语言使用JSON(为什么编程)

JSON是JavascriptObjectNotation的缩写,意思是Javascript对象表示法,是一种易于人类阅读和对编程友好的文本数据传递方法,是JavaScript语言规范定义的一个子...

何时在数据库中使用 JSON(数据库用json格式存储)

在本文中,您将了解何时应考虑将JSON数据类型添加到表中以及何时应避免使用它们。每天?分享?最新?软件?开发?,Devops,敏捷?,测试?以及?项目?管理?最新?,最热门?的?文章?,每天?花?...

MySQL 从零开始:05 数据类型(mysql数据类型有哪些,并举例)

前面的讲解中已经接触到了表的创建,表的创建是对字段的声明,比如:上述语句声明了字段的名称、类型、所占空间、默认值和是否可以为空等信息。其中的int、varchar、char和decimal都...

JSON对象花样进阶(json格式对象)

一、引言在现代Web开发中,JSON(JavaScriptObjectNotation)已经成为数据交换的标准格式。无论是从前端向后端发送数据,还是从后端接收数据,JSON都是不可或缺的一部分。...

深入理解 JSON 和 Form-data(json和formdata提交区别)

在讨论现代网络开发与API设计的语境下,理解客户端和服务器间如何有效且可靠地交换数据变得尤为关键。这里,特别值得关注的是两种主流数据格式:...

JSON 语法(json 语法 priority)

JSON语法是JavaScript语法的子集。JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔花括号保存对象方括号保存数组JS...

JSON语法详解(json的语法规则)

JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔大括号保存对象中括号保存数组注意:json的key是字符串,且必须是双引号,不能是单引号...

MySQL JSON数据类型操作(mysql的json)

概述mysql自5.7.8版本开始,就支持了json结构的数据存储和查询,这表明了mysql也在不断的学习和增加nosql数据库的有点。但mysql毕竟是关系型数据库,在处理json这种非结构化的数据...

JSON的数据模式(json数据格式示例)

像XML模式一样,JSON数据格式也有Schema,这是一个基于JSON格式的规范。JSON模式也以JSON格式编写。它用于验证JSON数据。JSON模式示例以下代码显示了基本的JSON模式。{"...

前端学习——JSON格式详解(后端json格式)

JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。它基于JavaScriptProgrammingLa...

什么是 JSON:详解 JSON 及其优势(什么叫json)

现在程序员还有谁不知道JSON吗?无论对于前端还是后端,JSON都是一种常见的数据格式。那么JSON到底是什么呢?JSON的定义...

PostgreSQL JSON 类型:处理结构化数据

PostgreSQL提供JSON类型,以存储结构化数据。JSON是一种开放的数据格式,可用于存储各种类型的值。什么是JSON类型?JSON类型表示JSON(JavaScriptO...

JavaScript:JSON、三种包装类(javascript 包)

JOSN:我们希望可以将一个对象在不同的语言中进行传递,以达到通信的目的,最佳方式就是将一个对象转换为字符串的形式JSON(JavaScriptObjectNotation)-JS的对象表示法...

Python数据分析 只要1分钟 教你玩转JSON 全程干货

Json简介:Json,全名JavaScriptObjectNotation,JSON(JavaScriptObjectNotation(记号、标记))是一种轻量级的数据交换格式。它基于J...

比较一下JSON与XML两种数据格式?(json和xml哪个好)

JSON(JavaScriptObjectNotation)和XML(eXtensibleMarkupLanguage)是在日常开发中比较常用的两种数据格式,它们主要的作用就是用来进行数据的传...

取消回复欢迎 发表评论:

请填写验证码