前置文章:
Elasticsearch-RestClient基础
Elasticsearch提供了基于JSON的DSL(Domain Specific Language)来定义查询。
match_all;match_query、multi_match_query;ids、range、term;geo_distance、geo_bounding_box;bool、function_score。0、基础查询语法
GET /indexName/_search
{
"query": {
"查询类型": {
"查询条件": "条件值"
}
}
}
1、查询所有&全文检索
match_all查询所有GET /indexName/_search
{
"query": {
"match_all": {}
}
}
match根据一个字段查询GET /indexName/_search
{
"query": {
"match": {
"FIELD": "TEXT"
}
}
}
multi_match根据多个字段查询GET /indexName/_search
{
"query": {
"multi_match" : {
"query": "TEXT",
"fields": [ "FIELD1", "*FIELD2" ]
}
}
}
实例:
# match_all查询所有
GET /hotel/_search
{
"query": {
"match_all": {}
}
}
# match根据一个字段查询
GET /hotel/_search
{
"query": {
"match": {
"all": "外滩"
}
}
}
# multi_match根据多个字段查询
GET /hotel/_search
{
"query": {
"multi_match": {
"query": "外滩如家",
"fields": ["name","brand","business"]
}
}
}
match和multi_match的区别Ⅰ match:根据一个字段查询;
Ⅱ multi_match:根据多个字段查询,参与查询字段越多,查询性能越差。
2、精确查询
term根据词条精确查询GET /indexName/_search
{
"query": {
"term": {
"FIELD": {
"value": "VALUE"
}
}
}
}
range根据值的范围查询GET /indexName/_search
{
"query": {
"range": {
"FIELD": {
"gte": value,
"lte": value
}
}
}
}
实例:
# term根据词条精确查询
GET /hotel/_search
{
"query": {
"term": {
"city": {
"value": "上海"
}
}
}
}
# range根据值的范围查询
GET /hotel/_search
{
"query": {
"range": {
"price": {
"gte": 300,
"lt": 350
}
}
}
}
Ⅰ term:根据词条精确匹配,一般搜索keyword类型、数值类型、布尔类型、日期类型字段;
Ⅱ range:根据数值范围查询,可以是数值、日期的范围。
3、地理查询
geo_bounding_box矩形范围查询GET /indexName/_search
{
"query": {
"geo_bounding_box": {
"FIELD": {
"top_left": {
"lat": value,
"lon": value
},
"bottom_right": {
"lat": value,
"lon": value
}
}
}
}
}
geo_distance圆形范围查询GET /indexName/_search
{
"query": {
"geo_distance": {
"distance": "XXkm",
"FIELD": {
"lat": value,
"lon": value
}
}
}
}
实例:
# geo_bounding_box矩形范围查询
GET /hotel/_search
{
"query": {
"geo_bounding_box": {
"location": {
"top_left": {
"lat": 40.8,
"lon": -74.0
},
"bottom_right": {
"lat": 40.7,
"lon": -73.0
}
}
}
}
}
# geo_distance圆形范围查询
GET /hotel/_search
{
"query": {
"geo_distance": {
"distance": "1km",
"location": {
"lat": 40.715,
"lon": -73.988
}
}
}
}
4、复合查询
function_score算分查询官方文档:Function score query。
GET /indexName/_search
{
"query": {
"function_score": {
"query": { "match": {"FIELD": "TEXT"} }, //原始查询条件
"functions": [
{
"filter": { "term": { "FIELD": "TEXT" } }, //过滤条件
"weight": VALUE //算分函数:script_score、weight、random_score、field_value_factor
}
],
"boost_mode": "MODE" //加权模式:multiply、replace、sum、avg、max、min
}
}
}
function_score query定义的三要素:
Ⅰ 过滤条件:哪些文档要加分;
Ⅱ 算分函数:如何计算function score;
Ⅲ 加权方式:function score 与 query score如何运算。
bool query复合查询官方文档:Boolean query。
GET /indexName/_search
{
"query": {
"bool" : {
"must" : {
"term" : { "FIELD" : "TEXT" }
},
"filter": {
"term" : { "FIELD" : "TEXT" }
},
"must_not" : {
"range" : {
"FIELD" : { "gte" : VALUE, "lte" : VALUE}
}
},
"should" : [
{ "term" : { "FIELD" : "TEXT" } },
{ "term" : { "FIELD" : "TEXT" } }
],
"minimum_should_match" : 1
}
}
}
bool query四种逻辑关系:
Ⅰ must:必须匹配的条件,可以理解为“与”;
Ⅱ should:选择性匹配的条件,可以理解为“或”;
Ⅲ must_not:必须不匹配的条件,不参与打分;
Ⅳ filter:必须匹配的条件,不参与打分。
1、排序
ES支持对搜索结果排序,默认是根据相关度算分(_score)来排序。可以排序字段类型有:keyword类型、数值类型、地理坐标类型、日期类型等。
GET /indexName/_search
{
"query" : {
"match_all" : { }
},
"sort" : [
{ "FIELD" : "MODE"} // desc、asc
]
}
GET /indexName/_search
{
"query" : {
"term" : { "user" : "kimchy" }
},
"sort" : [
{
"_geo_distance" : {
"FIELD" : [lat, lon],
"order" : "asc",
"unit" : "km"
}
}
]
}
实例:
GET /hotel/_search
{
"query": {
"match_all": {}
},
"sort": [
{
"score": {
"order": "desc"
},
"price": {
"order": "asc"
}
}
]
}
# 121.612534,31.035087
GET /hotel/_search
{
"query": {
"match_all": {}
},
"sort": [
{
"_geo_distance": {
"location": {
"lat": 31.035087,
"lon": 121.612534
},
"order": "asc",
"unit": "km"
}
}
]
}
2、分页
ES默认情况下只返回top10的数据。而如果要查询更多数据就需要修改分页参数了。ES中通过修改from、size参数来控制要返回的分页结果。
GET /indexName/_search
{
"query" : {
"match_all" : { }
},
"from": PAGE,
"size": PAGESIZE,
"sort" : [
{ "FIELD" : "MODE"} // desc、asc
]
}
from + size:after search:scroll:实例:
GET /hotel/_search
{
"query": {
"match_all": {}
},
"sort": [
{
"price": {
"order": "asc"
}
}
],
"from": 0,
"size": 5
}
3、高亮
高亮:就是在搜索结果中把搜索关键字突出显示。
GET /indexName/_search
{
"query" : {
"match" : {
"FIELD" : "TEXT"
}
},
"highlight": {
"fields" : {
"FIELD" : { // 指定高亮的字段
"pre_tags": "<em>", //标记高亮字段的前置标签
"post_tags": "</em>" //标记高亮字段的后置标签
}
}
}
}
实例:
GET /hotel/_search
{
"query": {
"match": {
"all": "如家"
}
},
"highlight": {
"fields": {
"name": {
"require_field_match": "false"
}
}
}
}
1、match_all查询
步骤:
① 获取request对象;
② 设置DSL语句;
③ 发送请求request,获取响应response;
④ 处理响应response,返回结果。
@Test
void matchAll(){
try {
// 1. 获取request对象
SearchRequest request = new SearchRequest("hotel");
// 2. 设置查询条件
request.source()
.query(QueryBuilders.matchAllQuery());
// 3. 发送请求,获得响应
SearchResponse response = client.search(request, RequestOptions.DEFAULT);
// 4. 处理查询结果输出
handleResponse(response);
} catch (IOException e) {
throw new RuntimeException(e);
}
}

封装处理响应的方法:
private void handleResponse(SearchResponse response) throws IOException {
// 4. 获取搜索内容
long count = response.getHits().getTotalHits().value;
System.out.println("搜索到的条数为:" + count + "条。");
SearchHit[] hits = response.getHits().getHits();
for (SearchHit hit : hits) {
// 4.1 将资源json串转换为对象
HotelDoc hotelDoc = JSON.parseObject(hit.getSourceAsString(), HotelDoc.class);
// 4.2 打印输出对象
System.out.println(hotelDoc);
}
}

2、全文检索查询
// 1. match 单字段查询
QueryBuilders.matchQuery("all", "如家");
GET /hotel/_search
{
"query": {
"match": {
"all": "如家"
}
}
}
// 2. multiMatch 多字段查询
QueryBuilders.multiMatchQuery("如家", "name", "business");
GET /hotel/_search
{
"query": {
"multi_match": {
"query": "如家",
"fields": ["name","brand","business"]
}
}
}
3、精确查询
// 3. term 查询
QueryBuilders.termQuery("city", "杭州");
GET /hotel/_search
{
"query": {
"term": {
"city": {
"value": "杭州"
}
}
}
}
// 4. range 查询
QueryBuilders.rangeQuery("price").gte(100).lte(300);
GET /hotel/_search
{
"query": {
"range": {
"price": {
"gte": 100,
"lt": 300
}
}
}
}
4、复合查询
// 2. 设置DSL语句
BoolQueryBuilder boolQuery = QueryBuilders.boolQuery();
// 2.1 添加must条件
boolQuery.must(QueryBuilders.termQuery("name", "上海"));
// 2.2 添加filter条件
boolQuery.filter(QueryBuilders.rangeQuery("price").lte("250"));
// 2.3 设置查询
request.source()
.query(boolQuery);

5、排序和分页
// 2. 设置DSL语句
request.source().query(QueryBuilders.matchQuery("name", "如家"));
// 2.1 排序
request.source().sort("price", SortOrder.ASC);
// 2.2 分页
request.source().from((page - 1) * pageSize).size(pageSize); // 此处from从0开始计数,第0条

6、高亮
// 2.2 设置高亮结果
request.source().highlighter(new HighlightBuilder().field("name").requireFieldMatch(false));

// 3. 发送请求获取结果
SearchResponse response = client.search(request, RequestOptions.DEFAULT);
long value = response.getHits().getTotalHits().value;
System.out.println("查询到的结果条数为:" + value + "条。");
// 4. 解析结果
SearchHit[] hits = response.getHits().getHits();
// 遍历解析封装
for (SearchHit hit : hits) {
// 4.1 获取hotelDoc对象
HotelDoc hotelDoc = JSON.parseObject(hit.getSourceAsString(), HotelDoc.class);
// 4.2 处理高亮
Map<String, HighlightField> highlightFields = hit.getHighlightFields();
if (!CollectionUtils.isEmpty(highlightFields)){
// 4.2.1 获取高亮字段结果
HighlightField highlightField = highlightFields.get("name");
if (highlightField != null){
// 4.2.2 取出高亮结果数组中的第一个元素,就是酒店名称
String name = highlightField.getFragments()[0].toString();
hotelDoc.setName(name);
}
}
// 5. 打印结果
System.out.println(hotelDoc);
}

7、距离排序
// 2.3 距离排序
String location = params.getLocation();
if (location != null && !"".equals(location)){
request.source().sort(SortBuilders
.geoDistanceSort("location", new GeoPoint(location))
.order(SortOrder.ASC)
.unit(DistanceUnit.KILOMETERS)
);
}

8、组合查询
// 2. 算分控制
FunctionScoreQueryBuilder functionScoreQuery =
QueryBuilders.functionScoreQuery(
// 原始查询,相关性算分的查询
boolQuery,
// function score的数组
new FunctionScoreQueryBuilder.FilterFunctionBuilder[]{
// 其中的一个function score元素
new FunctionScoreQueryBuilder.FilterFunctionBuilder(
// 过滤条件
QueryBuilders.termQuery("isAD", true),
// 算分函数:权重算分相乘
ScoreFunctionBuilders.weightFactorFunction(10)
)
});
request.source().query(functionScoreQuery);

以上即为Query DSL的部分内容,感谢阅读。
不知何故,我似乎无法获得包含我的聚合的响应...使用curl它按预期工作:HBZUMB01$curl-XPOST"http://localhost:9200/contents/_search"-d'{"size":0,"aggs":{"sport_count":{"value_count":{"field":"dwid"}}}}'我收到回复:{"took":4,"timed_out":false,"_shards":{"total":5,"successful":5,"failed":0},"hits":{"total":90,"max_score":0.0,"hits":[]},"a
1.回顾.TransportServicepublicclassTransportServiceextendsAbstractLifecycleComponentTransportService:方法:1publicfinalTextendsTransportResponse>voidsendRequest(finalTransport.Connectionconnection,finalStringaction,finalTransportRequestrequest,finalTransportRequestOptionsoptions,TransportResponseHandlerT>
我有一个Rails应用程序,现在设置了ElasticSearch和Tiregem以在模型上进行搜索,我想知道我应该如何设置我的应用程序以对模型中的某些索引进行模糊字符串匹配。我将我的模型设置为索引标题、描述等内容,但我想对其中一些进行模糊字符串匹配,但我不确定在何处进行此操作。如果您想发表评论,我将在下面包含我的代码!谢谢!在Controller中:defsearch@resource=Resource.search(params[:q],:page=>(params[:page]||1),:per_page=>15,load:true)end在模型中:classResource'Us
美团外卖搜索工程团队在Elasticsearch的优化实践中,基于Location-BasedService(LBS)业务场景对Elasticsearch的查询性能进行优化。该优化基于Run-LengthEncoding(RLE)设计了一款高效的倒排索引结构,使检索耗时(TP99)降低了84%。本文从问题分析、技术选型、优化方案等方面进行阐述,并给出最终灰度验证的结论。1.前言最近十年,Elasticsearch已经成为了最受欢迎的开源检索引擎,其作为离线数仓、近线检索、B端检索的经典基建,已沉淀了大量的实践案例及优化总结。然而在高并发、高可用、大数据量的C端场景,目前可参考的资料并不多。因此
开门见山|拉取镜像dockerpullelasticsearch:7.16.1|配置存放的目录#存放配置文件的文件夹mkdir-p/opt/docker/elasticsearch/node-1/config#存放数据的文件夹mkdir-p/opt/docker/elasticsearch/node-1/data#存放运行日志的文件夹mkdir-p/opt/docker/elasticsearch/node-1/log#存放IK分词插件的文件夹mkdir-p/opt/docker/elasticsearch/node-1/plugins若你使用了moba,直接右键新建即可如上图所示依次类推创建
文章目录概念索引相关操作创建索引更新副本查看索引删除索引索引的打开与关闭收缩索引索引别名查询索引别名文档相关操作新建文档查询文档更新文档删除文档映射相关操作查询文档映射创建静态映射创建索引并添加映射概念es中有三个概念要清楚,分别为索引、映射和文档(不用死记硬背,大概有个印象就可以)索引可理解为MySQL数据库;映射可理解为MySQL的表结构;文档可理解为MySQL表中的每行数据静态映射和动态映射上面已经介绍了,映射可理解为MySQL的表结构,在MySQL中,向表中插入数据是需要先创建表结构的;但在es中不必这样,可以直接插入文档,es可以根据插入的文档(数据),动态的创建映射(表结构),这就
我有一个关于配置elasticsearch以连接AWSelasticsearch服务以在生产环境中运行项目的问题。我的gem文件:gem'searchkick'gem'faraday_middleware-aws-signers-v4'gem'aws-sdk','~>2'gem"elasticsearch",">=1.0.15"引用:https://github.com/ankane/searchkick我的config/initializers/elasticsearch.rb文件:require"faraday_middleware/aws_signers_v4"ENV["ELAS
elasticsearch查看当前集群中的master节点是哪个需要使用_cat监控命令,具体如下。查看方法es主节点确定命令,以kibana上查看示例如下:GET_cat/nodesv返回结果示例如下:ipheap.percentram.percentcpuload_1mload_5mload_15mnode.rolemastername172.16.16.188529952.591.701.45mdi-elastic3172.16.16.187329950.990.991.19mdi-elastic2172.16.16.231699940.871.001.03mdi-elastic4172
我在查询中使用geo_distancefilter和tire,它工作正常:search.filter:geo_distance,:distance=>"#{request.distance}km",:location=>"#{request.lat},#{request.lng}"我预计结果会以某种方式包括到我用于过滤器的地理位置的计算距离。有没有办法告诉elasticsearch在响应中包含它,这样我就不必在ruby中为每个结果计算它?==更新==我在谷歌群组中的foundtheanswer:search.sortdoby"_geo_distance","location"=>"
如果不必像这样进行搜索就可以对元素进行计数,那就太好了Obj.search("id:*").count这可能吗? 最佳答案 在ElasticSearch中,您可以使用计数API对所有元素进行计数curl-XGEThttp://localhost:9200/index/_count参见CountAPI他们网站上的文档。 关于ruby-有没有办法计算ElasticSearch或Tire中索引的所有元素?,我们在StackOverflow上找到一个类似的问题: ht