草庐IT

asciifolding

全部标签

在Elasticsearch中使用Asciifold和UTF-8字符搜索

我在网页上索引所有名称,其中带有“josé”之类的口音。我希望能够用“Jose”和“José”搜索此名称。我应该如何设置带有一个字段“名称”的简单索引的索引映射和分析仪?我设置了这样的名称字段的分析仪:"analyzer":{"folding":{"tokenizer":"standard","filter":["lowercase","asciifolding"]}}但是,它将所有口音折叠成ASCII等效物,并在索引“é”时忽略了重音。我希望“é”char在索引中,我希望能够用“josé”或“jose”搜索“何塞”。看答案您需要用口音保留原始令牌。为了实现这一目标,您需要重新定义自己的asc