草庐IT

ES-脚本查询

1.概念Scripting是Elasticsearch支持的一种专门用于复杂场景下支持自定义编程的强大的脚本功能,ES支持多种脚本语言,如painless,其语法类似于Java,也有注释、关键字、类型、变量、函数等,其就要相对于其他脚本高出几倍的性能,并且安全可靠,可以用于内联和存储脚本。2.支持的语言(1)groovy:ES1.4.x-5.0的默认脚本语言(2)painless:JavaEE使用java语言开发,.Net使用C#/F#语言开发,Flutter使用Dart语言开发,同样,ES5.0+版本后的Scripting使用的语言默认就是painless,painless是一种专门用于El

ES、Kibana 8.0安装

文章目录一、下载软件二、安装elasticsearch1、解压缩文件2、启动ES3、页面登录ES三、安装Kibana1、解压缩文件2、启动Kibana3、开启远程访问权限4、登入配置5、重新生成token6、重置用户密码7、登录系统成功一、下载软件Elasticsearchhttps://www.elastic.co/cn/downloads/elasticsearchwgethttps://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-8.3.3-linux-x86_64.tar.gzKibanahttps://www.

ES数据类型

一、String类型String类型可以和java的string、mysql的varchar等同,但是为何会分为text、keyword呢?这两者又有什么区别?ES作为全文检索引擎,它强大的地方就在于分词和倒排序索引。而text和keyword的区别就在于是否分词(ps:什么叫分词?举个简单例子,“中国我爱你”这句话,如果使用了分词,那么这句话在底层的储存可能就是“中国”、“我爱你”,被拆分成了两个关键字)1)text——会分词就拿刚才的例子来说,“中国我爱你”这句话,如果使用text类型储存,我们不去特殊定义它的分词器,那么ES就会使用默认的分词器standard。ES的分词器(可先有个概念

ES常见问题

目录1.修改某个索引的分片数2.es写入超时3.重索引4.es常用命令5.华为云es开启安全模式,客户端使用方法6.运维的一些命令7.新加Es节点操作8.由tranlog引起的文件句柄过多问题解决1.修改某个索引的分片数#其中,index_patterns表示要匹配的索引名#"order":1,这个值,在的会overwite小的值,eg:默认的es_tempate一般我们都配置为0,这个什为1,那个这值里面的所以参数都会overwirte值为0的参数#number_of_shards表示分片数#number_of_routing_shards可扩展的最大分片数,要number_of_shard

ES 监控指标

红色为能够反映集群状态异常的关键指标蓝色为需重点关注的性能指标告警阈值均设置为宏变量,可根据集群情况自定义,表格中均为默认值ES进程监控模板指标具体的含义监控间隔WarningHighDisaster备注proc.num[,,,bootstrap.Elasticsearch]检测ES进程是否存活30s0ES节点监控模板指标具体的含义监控间隔WarningHighDisaster备注集群汇总指标cluster_status集群状态(0-green1-yellow2-red)1myellow(值=1)red(值=2)cluster_nodes_count集群总节点数1m有节点离开集群(本次数值cl

使用Prometheus监控docker compose方式部署的ES

需求收集ES的指标,并进行展示和告警;现状ES通过dockercompose安装所在环境的K8S集群有Prometheus和AlertManager及Grafana方案复用现有的监控体系,通过:Prometheus监控ES.具体实现为:采集端elasticsearch_exporter可以监控的指标为:NameTypeCardinalityHelpelasticsearch_breakers_estimated_size_bytesgauge4Estimatedsizeinbytesofbreakerelasticsearch_breakers_limit_size_bytesgauge4Li

ES 搜索引擎的分片数、副本数分配算法

名词定义分片一个分片是一个底层的工作单元,它仅保存了全部数据中的一部分。在分片内部机制中,我们将详细介绍分片是如何工作的,而现在我们只需知道一个分片是一个Lucene的实例,以及它本身就是一个完整的搜索引擎。我们的文档被存储和索引到分片内,但是应用程序是直接与索引而不是与分片进行交互。Elasticsearch是利用分片将数据分发到集群内各处的。分片是数据的容器,文档保存在分片内,分片又被分配到集群内的各个节点里。当你的集群规模扩大或者缩小时,Elasticsearch会自动的在各节点中迁移分片,使得数据仍然均匀分布在集群里。一个分片可以是主分片或者副本分片。索引内任意一个文档都归属于一个主分

ES 搜索引擎的分片数、副本数分配算法

名词定义分片一个分片是一个底层的工作单元,它仅保存了全部数据中的一部分。在分片内部机制中,我们将详细介绍分片是如何工作的,而现在我们只需知道一个分片是一个Lucene的实例,以及它本身就是一个完整的搜索引擎。我们的文档被存储和索引到分片内,但是应用程序是直接与索引而不是与分片进行交互。Elasticsearch是利用分片将数据分发到集群内各处的。分片是数据的容器,文档保存在分片内,分片又被分配到集群内的各个节点里。当你的集群规模扩大或者缩小时,Elasticsearch会自动的在各节点中迁移分片,使得数据仍然均匀分布在集群里。一个分片可以是主分片或者副本分片。索引内任意一个文档都归属于一个主分

数仓工具—Hive集成篇之UDF写ES(04)

Hive—UDF写ES遇到一个问题,让人很无语,前面其实我们介绍过Hive写ES或者是Hive数据导出到ES的方案,其实基本上就是两类第一类是通过Hive的外部表,借助es-hadoop组件完成第二类是通过数据同步工具来完成,例如dataX或者我们自己写Spark代码但是今天遇到的这个场景,这两种方法都不太合适,我们的场景是在阿里云上的maxcompute将数据写到华为云上的elasticsearch,maxcompute由于是阿里云的基础组件由于阿里云提供了数据集成组件,所以maxcompute根本就不支持外部表,其实我们第一时间想到的就是那直接使用阿里云的数据集成工具不就好了嘛,问题是阿里

数仓工具—Hive集成篇之UDF写ES(04)

Hive—UDF写ES遇到一个问题,让人很无语,前面其实我们介绍过Hive写ES或者是Hive数据导出到ES的方案,其实基本上就是两类第一类是通过Hive的外部表,借助es-hadoop组件完成第二类是通过数据同步工具来完成,例如dataX或者我们自己写Spark代码但是今天遇到的这个场景,这两种方法都不太合适,我们的场景是在阿里云上的maxcompute将数据写到华为云上的elasticsearch,maxcompute由于是阿里云的基础组件由于阿里云提供了数据集成组件,所以maxcompute根本就不支持外部表,其实我们第一时间想到的就是那直接使用阿里云的数据集成工具不就好了嘛,问题是阿里