草庐IT

【elasticsearch】记录ES查询数据结果为空的问题(单个字搜索可以,词语搜索为空)

No8g攻城狮 2023-12-23 原文

本文目录

一、基本环境

二、问题现象

三、案例介绍

四、问题原因

五、解决方案

第一步:删除索引

第二步:重建索引

第三步:触发程序灌数据

六、总结


一、基本环境

  • elasticsearch 版本:7.11.1
  • 客户端环境:kibana v7.11.1、Java8 应用程序模块。

其中 kibana 主要用于数据查询诊断和查阅日志,Java8 为主要的客户端,数据插入和查询都是由Java 实现的。

二、问题现象

共有三个部署环境,一个是开发环境、一个是测试环境、一个是正式环境。

前提:APP的首页搜索功能(搜索设备列表和搜索智能列表)在开发环境和正式环境一切正常。

测试人员在测试APP的首页搜索功能(搜索设备列表和搜索智能列表),发现搜索智能列表功能正常,而搜索设备时,无数据。

使用 kibana 里的开发工具查询时单个汉字可以搜索出设备列表,而使用词语去搜索设备时一直搜索不到任何数据。

查询数据命令:命令 索引/_search

下图中的命令是查询该索引下的所有数据

示例(根据某一字段查询)如下:

GET device-name-index/_search
{
  "query": {
    "bool": {
      "must": [
        {"term": {
          "deviceName": {
            "value": "开关"
          }
        }}
      ]
    }
  }
}

搜索“开”字可以把设备名称中带有“开”字的设备搜索出来,但是搜索“开关”词语时,设备名称中带有“开关”词语的设备结果为空(ES中实际上有数据)。

三、案例介绍

使用 elasticsearch 存储设备列表的主要信息,document 内的 field,基本上是 integer keywordes 自动创建的索引 device-name-index 如下:

查询 mapping 信息,命令如下:

GET device-name-index/_mapping

结果返回如下:

{
  "device-name-index" : {
    "mappings" : {
      "properties" : {
        "deviceId" : {
          "type" : "integer"
        },
        "deviceModel" : {
          "type" : "text"
        },
        "deviceName" : {
          "type" : "text"
        },
        "deviceType" : {
          "type" : "text"
        },
        "floorName" : {
          "type" : "text"
        },
        "id" : {
          "type" : "integer"
        },
        "roomName" : {
          "type" : "text"
        },
        "sn" : {
          "type" : "text"
        }
      }
    }
  }
}

而部署在开发环境里的 es 索引里的字段类型如下:

{
  "device-name-index" : {
    "mappings" : {
      "properties" : {
        "deviceId" : {
          "type" : "integer"
        },
        "deviceModel" : {
          "type" : "keyword"
        },
        "deviceName" : {
          "type" : "text",
          "fields" : {
            "ikmaxword" : {
              "type" : "text",
              "analyzer" : "ik_max_word"
            },
            "pinyin" : {
              "type" : "text",
              "analyzer" : "pinyin"
            }
          },
          "analyzer" : "standard"
        },
        "deviceType" : {
          "type" : "keyword"
        },
        "floorName" : {
          "type" : "keyword"
        },
        "roomName" : {
          "type" : "keyword"
        },
        "sn" : {
          "type" : "keyword"
        }
      }
    }
  }
}

以上字段,只需要关注 deviceName 即可。因为搜索是根据此字段检索数据的。

可以很清楚的看到 deviceName 字段使用了 ik分词器(ik_max_word)。

四、问题原因

按照 mapping 返回结果来看,部署在测试环境的字段 deviceName 没有添加 ik 分词器,而 es 采取的策略是,如果没有添加自定义的分词器,那么便会使用 es 默认的标准分词器分词,这就是导致单个字搜索时可以检索出数据,而使用词语检索数据时无数据的原因。

五、解决方案

第一步:删除索引

命令如下:

DELETE device-name-index

第二步:重建索引

命令如下:

PUT device-name-index
{
	"mappings": {
		"properties": {
			"deviceId": {
				"type": "integer"
			},
			"deviceModel": {
				"type": "keyword"
			},
			"deviceName": {
				"type": "text",
				"fields": {
					"ikmaxword": {
						"type": "text",
						"analyzer": "ik_max_word"
					},
					"pinyin": {
						"type": "text",
						"analyzer": "pinyin"
					}
				},
				"analyzer": "standard"
			},
			"deviceType": {
				"type": "keyword"
			},
			"floorName": {
				"type": "keyword"
			},
			"roomName": {
				"type": "keyword"
			},
			"sn": {
				"type": "keyword"
			}
		}
	}
}

第三步:触发程序灌数据

在我的项目中只需要修改设备名称即可触发数据内容变更(全量删除并全量更新),再次在APP首页搜索设备名称,单个字和词语都可以检索出数据,问题搞定。

使用ik分词器后,查看分词结果情况,命令格式:

GET 索引/_doc/索引下某字段_id/_termvectors?fields=字段名称.ikmaxword

使用es默认的分词器查看分词结果情况,命令:

GET 索引/_doc/索引下某字段_id/_termvectors?fields=字段名称

示例如下:

GET device-name-index/_doc/cO-TNIMBWdpBXCOgNBnM/_termvectors?fields=deviceName.ikmaxword

六、总结

问题虽小,但一定要追溯源头,比如此次测试环境的不规范操作。后期如果有删除索引的操作,应该先手动建立索引后,再灌数据,而不是直接让其自动 mapping 建立索引,自动 mapping 建立的字段类型,可能不是我们期望的。

完结!

有关【elasticsearch】记录ES查询数据结果为空的问题(单个字搜索可以,词语搜索为空)的更多相关文章

  1. ruby - 为什么我可以在 Ruby 中使用 Object#send 访问私有(private)/ protected 方法? - 2

    类classAprivatedeffooputs:fooendpublicdefbarputs:barendprivatedefzimputs:zimendprotecteddefdibputs:dibendendA的实例a=A.new测试a.foorescueputs:faila.barrescueputs:faila.zimrescueputs:faila.dibrescueputs:faila.gazrescueputs:fail测试输出failbarfailfailfail.发送测试[:foo,:bar,:zim,:dib,:gaz].each{|m|a.send(m)resc

  2. ruby - ECONNRESET (Whois::ConnectionError) - 尝试在 Ruby 中查询 Whois 时出错 - 2

    我正在用Ruby编写一个简单的程序来检查域列表是否被占用。基本上它循环遍历列表,并使用以下函数进行检查。require'rubygems'require'whois'defcheck_domain(domain)c=Whois::Client.newc.query("google.com").available?end程序不断出错(即使我在google.com中进行硬编码),并打印以下消息。鉴于该程序非常简单,我已经没有什么想法了-有什么建议吗?/Library/Ruby/Gems/1.8/gems/whois-2.0.2/lib/whois/server/adapters/base.

  3. ruby - 解析 RDFa、微数据等的最佳方式是什么,使用统一的模式/词汇(例如 schema.org)存储和显示信息 - 2

    我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i

  4. ruby - 使用 Vim Rails,您可以创建一个新的迁移文件并一次性打开它吗? - 2

    使用带有Rails插件的vim,您可以创建一个迁移文件,然后一次性打开该文件吗?textmate也可以这样吗? 最佳答案 你可以使用rails.vim然后做类似的事情::Rgeneratemigratonadd_foo_to_bar插件将打开迁移生成的文件,这正是您想要的。我不能代表textmate。 关于ruby-使用VimRails,您可以创建一个新的迁移文件并一次性打开它吗?,我们在StackOverflow上找到一个类似的问题: https://sta

  5. ruby-on-rails - 如果为空或不验证数值,则使属性默认为 0 - 2

    我希望我的UserPrice模型的属性在它们为空或不验证数值时默认为0。这些属性是tax_rate、shipping_cost和price。classCreateUserPrices8,:scale=>2t.decimal:tax_rate,:precision=>8,:scale=>2t.decimal:shipping_cost,:precision=>8,:scale=>2endendend起初,我将所有3列的:default=>0放在表格中,但我不想要这样,因为它已经填充了字段,我想使用占位符。这是我的UserPrice模型:classUserPrice回答before_val

  6. ruby - 我可以使用 Ruby 从 CSV 中删除列吗? - 2

    查看Ruby的CSV库的文档,我非常确定这是可能且简单的。我只需要使用Ruby删除CSV文件的前三列,但我没有成功运行它。 最佳答案 csv_table=CSV.read(file_path_in,:headers=>true)csv_table.delete("header_name")csv_table.to_csv#=>ThenewCSVinstringformat检查CSV::Table文档:http://ruby-doc.org/stdlib-1.9.2/libdoc/csv/rdoc/CSV/Table.html

  7. ruby - 我可以使用 aws-sdk-ruby 在 AWS S3 上使用事务性文件删除/上传吗? - 2

    我发现ActiveRecord::Base.transaction在复杂方法中非常有效。我想知道是否可以在如下事务中从AWSS3上传/删除文件:S3Object.transactiondo#writeintofiles#raiseanexceptionend引发异常后,每个操作都应在S3上回滚。S3Object这可能吗?? 最佳答案 虽然S3API具有批量删除功能,但它不支持事务,因为每个删除操作都可以独立于其他操作成功/失败。该API不提供任何批量上传功能(通过PUT或POST),因此每个上传操作都是通过一个独立的API调用完成的

  8. ruby - Sinatra:运行 rspec 测试时记录噪音 - 2

    Sinatra新手;我正在运行一些rspec测试,但在日志中收到了一堆不需要的噪音。如何消除日志中过多的噪音?我仔细检查了环境是否设置为:test,这意味着记录器级别应设置为WARN而不是DEBUG。spec_helper:require"./app"require"sinatra"require"rspec"require"rack/test"require"database_cleaner"require"factory_girl"set:environment,:testFactoryGirl.definition_file_paths=%w{./factories./test/

  9. ruby-on-rails - 在 Rails 和 ActiveRecord 中查询时忽略某些字段 - 2

    我知道我可以指定某些字段来使用pluck查询数据库。ids=Item.where('due_at但是我想知道,是否有一种方法可以指定我想避免从数据库查询的某些字段。某种反拔?posts=Post.where(published:true).do_not_lookup(:enormous_field) 最佳答案 Model#attribute_names应该返回列/属性数组。您可以排除其中一些并传递给pluck或select方法。像这样:posts=Post.where(published:true).select(Post.attr

  10. ruby - 有人可以帮助解释类创建的 post_initialize 回调吗 (Sandi Metz) - 2

    我正在阅读SandiMetz的POODR,并且遇到了一个我不太了解的编码原则。这是代码:classBicycleattr_reader:size,:chain,:tire_sizedefinitialize(args={})@size=args[:size]||1@chain=args[:chain]||2@tire_size=args[:tire_size]||3post_initialize(args)endendclassMountainBike此代码将为其各自的属性输出1,2,3,4,5。我不明白的是查找方法。当一辆山地自行车被实例化时,因为它没有自己的initialize方法

随机推荐