node.js - 文本搜索空格转义

coder 2023-11-03 原文

我正在使用 nodeJs Mongoose 执行文本搜索；

var mongoose = require('mongoose');
var config = require('../config');
var mongoosePaginate = require('mongoose-paginate'); 
var poiSchema = mongoose.Schema({
    city:String,
    cap:String,
    country:String,
    address: String,
    description: String,
    latitude: Number,
    longitude: Number,
    title: String,
    url: String,
    images:Array,
    freeText:String,
    owner:String,
});
poiSchema.index({'$**': 'text'});

poiSchema.plugin(mongoosePaginate);
mongoose.Promise = global.Promise;
mongoose.connect(config.database);
module.exports = mongoose.model('Poi', poiSchema);

如你所见

poiSchema.index({'$**': 'text'});

我在我的模式中的每个字段上创建了一个文本索引。

当我尝试执行文本搜索时，我开发了这段代码:

var term = "a search term";

var query = {'$text':{'$search': term}};
Poi.paginate(query, {}, function(err, pois) {
    if(!pois){
        pois = {
            docs:[],
            total:0
        };
    }
    res.json({search:pois.docs,total:pois.total});
});

不幸的是，当我在术语搜索中使用空格时，它会获取集合中与术语搜索中的每个字段匹配的所有文档，并用空格分隔。

我想文本索引有作为分词器的空白；

我需要知道如何转义空格，以便在不拆分搜索词的情况下搜索具有整个搜索词的每个字段。

我尝试用 \\ 替换空格，但没有任何变化。

有人可以帮助我吗？

最佳答案

MongoDB 允许对字符串内容进行文本搜索查询，支持不区分大小写、定界符、停用词和词干提取。默认情况下，搜索字符串中的字词是或运算的。从文档中，$search 字符串是 ...

A string of terms that MongoDB parses and uses to query the text index. MongoDB performs a logical OR search of the terms unless specified as a phrase.

因此，如果您的 $search 字符串中至少有一个术语匹配，则 MongoDB 返回该文档，MongoDB 将使用所有术语进行搜索(其中一个术语是一个字符串，由空格)。

您可以通过指定短语来更改此行为，方法是将多个术语括在引号中。在您的问题中，我认为您想搜索确切的短语:一个搜索词，因此只需将该短语括在转义字符串引号中即可。

这里有一些例子:

鉴于这些文档:

{ "_id" : ..., "name" : "search" }
{ "_id" : ..., "name" : "term" }
{ "_id" : ..., "name" : "a search term" }

以下查询将返回...

// returns the third document because that is the only
// document which contains the phrase: 'a search term'
db.collection.find({ $text: { $search: "\"a search term\"" } })

// returns all three documents because each document contains
// at least one of the 3 terms in this search string
db.collection.find({ $text: { $search: "a search term" } })

因此，总而言之，您通过将搜索词组包含在转义字符串引号中来“转义空格”...而不是 "a search term" 使用 "\"a search term\"".

关于node.js - 文本搜索空格转义，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/46510708/

node js code search 34 node.js mongodb mongoose full-text-indexing

有关node.js - 文本搜索空格转义的更多相关文章

ruby - 使用 ruby 将 HTML 转换为纯文本并维护结构/格式 - 2
我想将html转换为纯文本。不过，我不想只删除标签，我想智能地保留尽可能多的格式。为插入换行符标签，检测段落并格式化它们等。输入非常简单，通常是格式良好的html(不是整个文档，只是一堆内容，通常没有anchor或图像)。我可以将几个正则表达式放在一起，让我达到80%，但我认为可能有一些现有的解决方案更智能。最佳答案首先，不要尝试为此使用正则表达式。很有可能你会想出一个脆弱/脆弱的解决方案，它会随着HTML的变化而崩溃，或者很难管理和维护。您可以使用Nokogiri快速解析HTML并提取文本:require'nokogiri'h
ruby - 匹配未转义的平衡定界符对 - 2
如何匹配未被反斜杠转义的平衡定界符对(其本身未被反斜杠转义)(无需考虑嵌套)？例如对于反引号，我试过了，但是转义的反引号没有像转义那样工作。regex=/(?!$1:"how\\"#expected"how\\`are"上面的正则表达式不考虑由反斜杠转义并位于反引号前面的反斜杠，但我愿意考虑。StackOverflow如何做到这一点？这样做的目的并不复杂。我有文档文本，其中包括内联代码的反引号，就像StackOverflow一样，我想在HTML文件中显示它，内联代码用一些spanMaterial装饰。不会有嵌套，但转义反引号或转义反斜杠可能出现在任何地方。
ruby-on-rails - Nokogiri:使用 XPath 搜索 <div> - 2
我使用Nokogiri(Rubygem)css搜索寻找某些在我的html里面。看起来Nokogiri的css搜索不喜欢正则表达式。我想切换到Nokogiri的xpath搜索，因为这似乎支持搜索字符串中的正则表达式。如何在xpath搜索中实现下面提到的(伪)css搜索？require'rubygems'require'nokogiri'value=Nokogiri::HTML.parse(ABBlaCD3"HTML_END#my_blockisgivenmy_bl="1"#my_eqcorrespondstothisregexmy_eq="\/[0-9]+\/"#FIXMEThefoll
ruby - 字符串文字中的转义状态作为 `String#tr` 的参数 - 2
对于作为String#tr参数的单引号字符串文字中反斜杠的转义状态，我觉得有些神秘。你能解释一下下面三个例子之间的对比吗？我特别不明白第二个。为了避免复杂化，我在这里使用了'd'，在双引号中转义时不会改变含义("\d"="d")。'\\'.tr('\\','x')#=>"x"'\\'.tr('\\d','x')#=>"\\"'\\'.tr('\\\d','x')#=>"x" 最佳答案在tr中转义tr的第一个参数非常类似于正则表达式中的括号字符分组。您可以在表达式的开头使用^来否定匹配(替换任何不匹配的内容)并使用例如a-f来匹配一
ruby - ruby 乘法语句中星号中断语法前的空格 - 2
在添加一些空格以使代码更具可读性时(与上面的代码对齐)，我遇到了这个:classCdefx42endendm=C.new现在这将给出“错误数量的参数”:m.x*m.x这将给出“语法错误，意外的tSTAR，期待$end”:2/m.x*m.x这里的解析器到底发生了什么？我使用Ruby1.9.2和2.1.5进行了测试。最佳答案 *用于运算符(42*42)和参数解包(myfun*[42,42])。当你这样做时:m.x*m.x2/m.x*m.xRuby将此解释为参数解包，而不是*运算符(即乘法)。如果您不熟悉它，参数解包(有时也称为“spl
ruby - 如何搜索有用的 ruby - 2
寻找有用的ruby的好网站是什么？最佳答案 AgileWebDevelopment列出插件(虽然不是rubygems，我不确定为什么)，并允许人们对它们进行评级。RubyToolbox按类别列出gem并比较它们的受欢迎程度。Rubygems有一个搜索框。StackOverflow对最有用的rails插件和rubygems有疑问。关于ruby-如何搜索有用的ruby，我们在StackOverflow上找到一个类似的问题： https://stacko
ruby - 如何搜索、递增和替换 Ruby 字符串中的整数子字符串？ - 2
我有很多这样的文档:foo_1foo_2foo_3bar_1foo_4...我想通过获取foo_[X]的所有实例并将它们中的每一个替换为foo_[X+1]来转换它们。在这个例子中:foo_2foo_3foo_4bar_1foo_5...我可以用gsub和一个block来做到这一点吗？如果不是，最干净的方法是什么？我真的在寻找一个优雅的解决方案，因为我总是可以暴力破解它，但我觉得有一些正则表达式技巧值得学习。最佳答案我(完全)不懂Ruby，但类似这样的东西应该可以工作:"foo_1foo_2".gsub(/(foo_)(\d+)/
ruby-on-rails - rspec - 我怎样才能让 "pendings"有我的文本而不仅仅是 "No reason given" - 2
我有这个代码:context"Visitingtheusers#indexpage."dobefore(:each){visitusers_path}subject{page}pending('iii'){shouldhave_no_css('table#users')}pending{shouldhavecontent('Youhavereachedthispageduetoapermissionic错误')}它会导致几个待处理，例如ManagingUsersGivenapractitionerloggedin.Visitingtheusers#indexpage.#Noreason
ruby - Ruby 中的必应搜索 API - 2
我读了"BingSearchAPI-QuickStart"但我不知道如何在Ruby中发出这个http请求(Weary)如何在Ruby中翻译“Stream_context_create()”？这是什么意思？"BingSearchAPI-QuickStart"我想使用RubySDK，但我发现那些已被弃用前(Rbing)https://github.com/mikedemers/rbing您知道Bing搜索API的最新包装器(仅限Web的结果)吗？最佳答案好吧，经过一个小时的挫折，我想出了一个办法来做到这一点。这段代码很糟糕，因为它是
ruby - 如何为 pbcopy 生成富文本链接 - 2
我一直在玩一个脚本，它在Chrome中获取选定的文本并在Google中查找它，提供四个最佳选择，然后粘贴相关链接。它以不同的格式粘贴，具体取决于当前在Chrome中打开的页面-DokuWiki打开的DokuWiki格式，普通网站的HTML，我想要我的WordPress所见即所得编辑器的富文本。我尝试使用pbpaste-Preferrtf来查看没有其他样式的富文本链接在粘贴板上的样子，但它仍然输出纯文本。在文本编辑中保存文件并进行试验后，我想出了以下内容text=%q|{\rtf1{\field{\*\fldinst{HYPERLINK"URL"}}{\fldrsltTEXT}}}|te

node.js - 文本搜索空格转义

有关node.js - 文本搜索空格转义的更多相关文章

随机推荐