【elasticsearch】记录ES查询数据结果为空的问题（单个字搜索可以，词语搜索为空）

GET device-name-index/_search
{
  "query": {
    "bool": {
      "must": [
        {"term": {
          "deviceName": {
            "value": "开关"
          }
        }}
      ]
    }
  }
}

搜索“开”字可以把设备名称中带有“开”字的设备搜索出来，但是搜索“开关”词语时，设备名称中带有“开关”词语的设备结果为空（ES中实际上有数据）。

三、案例介绍

使用 elasticsearch 存储设备列表的主要信息，document 内的 field，基本上是 integer 或 keyword，es 自动创建的索引 device-name-index 如下：

查询 mapping 信息，命令如下：

GET device-name-index/_mapping

结果返回如下：

{
  "device-name-index" : {
    "mappings" : {
      "properties" : {
        "deviceId" : {
          "type" : "integer"
        },
        "deviceModel" : {
          "type" : "text"
        },
        "deviceName" : {
          "type" : "text"
        },
        "deviceType" : {
          "type" : "text"
        },
        "floorName" : {
          "type" : "text"
        },
        "id" : {
          "type" : "integer"
        },
        "roomName" : {
          "type" : "text"
        },
        "sn" : {
          "type" : "text"
        }
      }
    }
  }
}

而部署在开发环境里的 es 索引里的字段类型如下：

{
  "device-name-index" : {
    "mappings" : {
      "properties" : {
        "deviceId" : {
          "type" : "integer"
        },
        "deviceModel" : {
          "type" : "keyword"
        },
        "deviceName" : {
          "type" : "text",
          "fields" : {
            "ikmaxword" : {
              "type" : "text",
              "analyzer" : "ik_max_word"
            },
            "pinyin" : {
              "type" : "text",
              "analyzer" : "pinyin"
            }
          },
          "analyzer" : "standard"
        },
        "deviceType" : {
          "type" : "keyword"
        },
        "floorName" : {
          "type" : "keyword"
        },
        "roomName" : {
          "type" : "keyword"
        },
        "sn" : {
          "type" : "keyword"
        }
      }
    }
  }
}

以上字段，只需要关注 deviceName 即可。因为搜索是根据此字段检索数据的。

可以很清楚的看到 deviceName 字段使用了 ik分词器（ik_max_word）。

四、问题原因

按照 mapping 返回结果来看，部署在测试环境的字段 deviceName 没有添加 ik 分词器，而 es 采取的策略是，如果没有添加自定义的分词器，那么便会使用 es 默认的标准分词器分词，这就是导致单个字搜索时可以检索出数据，而使用词语检索数据时无数据的原因。

五、解决方案

第一步：删除索引

命令如下：

DELETE device-name-index

第二步：重建索引

命令如下：

PUT device-name-index
{
	"mappings": {
		"properties": {
			"deviceId": {
				"type": "integer"
			},
			"deviceModel": {
				"type": "keyword"
			},
			"deviceName": {
				"type": "text",
				"fields": {
					"ikmaxword": {
						"type": "text",
						"analyzer": "ik_max_word"
					},
					"pinyin": {
						"type": "text",
						"analyzer": "pinyin"
					}
				},
				"analyzer": "standard"
			},
			"deviceType": {
				"type": "keyword"
			},
			"floorName": {
				"type": "keyword"
			},
			"roomName": {
				"type": "keyword"
			},
			"sn": {
				"type": "keyword"
			}
		}
	}
}

第三步：触发程序灌数据

在我的项目中只需要修改设备名称即可触发数据内容变更（全量删除并全量更新），再次在APP首页搜索设备名称，单个字和词语都可以检索出数据，问题搞定。

使用ik分词器后，查看分词结果情况，命令格式：

GET 索引/_doc/索引下某字段_id/_termvectors?fields=字段名称.ikmaxword

使用es默认的分词器查看分词结果情况，命令：

GET 索引/_doc/索引下某字段_id/_termvectors?fields=字段名称

示例如下：

GET device-name-index/_doc/cO-TNIMBWdpBXCOgNBnM/_termvectors?fields=deviceName.ikmaxword

六、总结

问题虽小，但一定要追溯源头，比如此次测试环境的不规范操作。后期如果有删除索引的操作，应该先手动建立索引后，再灌数据，而不是直接让其自动 mapping 建立索引，自动 mapping 建立的字段类型，可能不是我们期望的。

完结！

elasticsearch 词语 34 strong xff 搜索引擎大数据

有关【elasticsearch】记录ES查询数据结果为空的问题（单个字搜索可以，词语搜索为空）的更多相关文章

ruby - 为什么我可以在 Ruby 中使用 Object#send 访问私有(private)/ protected 方法？ - 2
类classAprivatedeffooputs:fooendpublicdefbarputs:barendprivatedefzimputs:zimendprotecteddefdibputs:dibendendA的实例a=A.new测试a.foorescueputs:faila.barrescueputs:faila.zimrescueputs:faila.dibrescueputs:faila.gazrescueputs:fail测试输出failbarfailfailfail.发送测试[:foo,:bar,:zim,:dib,:gaz].each{|m|a.send(m)resc
ruby - ECONNRESET (Whois::ConnectionError) - 尝试在 Ruby 中查询 Whois 时出错 - 2
我正在用Ruby编写一个简单的程序来检查域列表是否被占用。基本上它循环遍历列表，并使用以下函数进行检查。require'rubygems'require'whois'defcheck_domain(domain)c=Whois::Client.newc.query("google.com").available?end程序不断出错(即使我在google.com中进行硬编码)，并打印以下消息。鉴于该程序非常简单，我已经没有什么想法了-有什么建议吗？/Library/Ruby/Gems/1.8/gems/whois-2.0.2/lib/whois/server/adapters/base.
ruby - 解析 RDFa、微数据等的最佳方式是什么，使用统一的模式/词汇(例如 schema.org)存储和显示信息 - 2
我主要使用Ruby来执行此操作，但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式，例如使用这个yaml文件，它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i
ruby - 使用 Vim Rails，您可以创建一个新的迁移文件并一次性打开它吗？ - 2
使用带有Rails插件的vim，您可以创建一个迁移文件，然后一次性打开该文件吗？textmate也可以这样吗？最佳答案你可以使用rails.vim然后做类似的事情::Rgeneratemigratonadd_foo_to_bar插件将打开迁移生成的文件，这正是您想要的。我不能代表textmate。关于ruby-使用VimRails，您可以创建一个新的迁移文件并一次性打开它吗？，我们在StackOverflow上找到一个类似的问题： https://sta
ruby-on-rails - 如果为空或不验证数值，则使属性默认为 0 - 2
我希望我的UserPrice模型的属性在它们为空或不验证数值时默认为0。这些属性是tax_rate、shipping_cost和price。classCreateUserPrices8,:scale=>2t.decimal:tax_rate,:precision=>8,:scale=>2t.decimal:shipping_cost,:precision=>8,:scale=>2endendend起初，我将所有3列的:default=>0放在表格中，但我不想要这样，因为它已经填充了字段，我想使用占位符。这是我的UserPrice模型:classUserPrice回答before_val
ruby - 我可以使用 Ruby 从 CSV 中删除列吗？ - 2
查看Ruby的CSV库的文档，我非常确定这是可能且简单的。我只需要使用Ruby删除CSV文件的前三列，但我没有成功运行它。最佳答案 csv_table=CSV.read(file_path_in,:headers=>true)csv_table.delete("header_name")csv_table.to_csv#=>ThenewCSVinstringformat检查CSV::Table文档:http://ruby-doc.org/stdlib-1.9.2/libdoc/csv/rdoc/CSV/Table.html
ruby - 我可以使用 aws-sdk-ruby 在 AWS S3 上使用事务性文件删除/上传吗？ - 2
我发现ActiveRecord::Base.transaction在复杂方法中非常有效。我想知道是否可以在如下事务中从AWSS3上传/删除文件:S3Object.transactiondo#writeintofiles#raiseanexceptionend引发异常后，每个操作都应在S3上回滚。S3Object这可能吗？？最佳答案虽然S3API具有批量删除功能，但它不支持事务，因为每个删除操作都可以独立于其他操作成功/失败。该API不提供任何批量上传功能(通过PUT或POST)，因此每个上传操作都是通过一个独立的API调用完成的
ruby - Sinatra:运行 rspec 测试时记录噪音 - 2
Sinatra新手；我正在运行一些rspec测试，但在日志中收到了一堆不需要的噪音。如何消除日志中过多的噪音？我仔细检查了环境是否设置为:test，这意味着记录器级别应设置为WARN而不是DEBUG。spec_helper:require"./app"require"sinatra"require"rspec"require"rack/test"require"database_cleaner"require"factory_girl"set:environment,:testFactoryGirl.definition_file_paths=%w{./factories./test/
ruby-on-rails - 在 Rails 和 ActiveRecord 中查询时忽略某些字段 - 2
我知道我可以指定某些字段来使用pluck查询数据库。ids=Item.where('due_at但是我想知道，是否有一种方法可以指定我想避免从数据库查询的某些字段。某种反拔？posts=Post.where(published:true).do_not_lookup(:enormous_field) 最佳答案 Model#attribute_names应该返回列/属性数组。您可以排除其中一些并传递给pluck或select方法。像这样:posts=Post.where(published:true).select(Post.attr
ruby - 有人可以帮助解释类创建的 post_initialize 回调吗 (Sandi Metz) - 2
我正在阅读SandiMetz的POODR，并且遇到了一个我不太了解的编码原则。这是代码:classBicycleattr_reader:size,:chain,:tire_sizedefinitialize(args={})@size=args[:size]||1@chain=args[:chain]||2@tire_size=args[:tire_size]||3post_initialize(args)endendclassMountainBike此代码将为其各自的属性输出1,2,3,4,5。我不明白的是查找方法。当一辆山地自行车被实例化时，因为它没有自己的initialize方法