草庐IT

语义搜索

全部标签

ruby - Ruby 字符串字典中的快速模糊/近似搜索

我有一个包含50K到100K字符串的字典(最多可以包含50个以上的字符),我正在尝试查找给定字符串是否在具有“编辑”距离公差的字典中。(例如Levenshtein)。在进行搜索之前,我可以预先计算任何类型的数据结构。我的目标是尽快针对该字典运行数千个字符串并返回最近的邻居。如果有一个明显更快的算法,我会得到一个bool值来说明给定的是否在字典中为此,我首先尝试计算所有Levenshtein距离并取最小值,这显然非常慢。所以我尝试根据这篇文章实现一个LevenshteinTriehttp://stevehanov.ca/blog/index.php?id=114在这里查看我的重现基准的要

ruby-on-rails - 向我的网站添加完整网络搜索的最佳方式?

我需要在我的站点中添加完整的网络搜索。我需要像GoogleCustomSearch这样的东西,但没有广告,而且它必须是免费的。任何可以为我的站点编制索引并允许我进行搜索的Web服务或开源项目的推荐都会有所帮助。如果有帮助的话,我的网站是用ruby​​onrails制作的。我会将这个问题制作成社区维基,这样您就可以编辑我糟糕的英语。我想很多人都可以从这个问题中受益。 最佳答案 查看Lucene。它是一个开源搜索引擎,在您自己的网站上实现肯定会是一种有趣的学习体验。我相信它最初是由Excite人员设计的。

ruby - 搜索并替换为 ruby​​ 正则表达式

我在包含HTML的MySQL列中有一个文本blob字段。我必须更改一些标记,所以我想我会在ruby​​脚本中完成。Ruby在这里无关紧要,但很高兴看到它的答案。标记如下所示:foobarmeow我只需要更改第一个foo每个文本block到something_else同时保留字符串的其余部分。似乎无法使用Ruby获得正确的PCRE正则表达式。 最佳答案 #Theregexliteralsyntaxusing%r{...}allows/inyourregexwithoutescapingnew_str=my_str.sub(%r{[^}

ruby-on-rails - 在 Ruby on Rails 中搜索 - 如何搜索输入的每个单词而不是确切的字符串?

我已经使用ruby​​onrails构建了一个博客应用程序,我正在尝试实现一个搜索功能。博客应用程序允许用户标记帖子。标签在它们自己的表中创建并且belong_to:post。创建标签时,标签表中的记录也会创建,其中标签的名称为tag_name并通过post_id关联。标签是字符串。我试图让用户以任何顺序搜索任何单词tag_name。这就是我的意思。假设某个帖子有一个标签是“rubycodecontroller”。在我当前的搜索功能中,如果用户搜索“ruby”、“ruby代码”或“ruby代码Controller”,就会找到该标签。如果用户输入“rubycontroller”,它将不会

ruby-on-rails - 如何将条件 "IS NOT NULL"添加到 Thinking Sphinx 搜索中

我正在使用ThinkingSphinx进行全文搜索,关注thisvideo.我想做以下事情:@articles=Article.search(params[:search],:conditions=>"published_atISNOTNULL",:order=>:created_at)问题是这行不通。搜索方法似乎只接受散列条件。我尝试了几种方法,但我对如何将“published_atISNOTNULL”表示为哈希一无所知... 最佳答案 在Railscasts给出了解决方案Ifyouwant*all*resultsforthatm

ruby - 如何打开一个文件并搜索一个词?

如何使用Ruby打开文件并在其中搜索单词? 最佳答案 所有提出的解决方案的时间复杂度都是O(n)。为简单起见,我使用String#include?来检查单词。这可以用string=~regex形式的正则表达式代替。阅读完整文件并在其中搜索。File.read(filename).include?(word)如果您的文件非常大,这不是最佳解决方案,因为您会将整个文件读入内存,然后再开始搜索。你的内存复杂度是O(n)逐行读取文件并在每一行中搜索File.open(filename)do|f|f.any?do|line|line.incl

sql - 用于 250K+ 字符串的通配符搜索的 Fast(er) 方法

我在MySQL数据库中有一个英语词典,其中只有超过250K个条目,我正在使用一个简单的ruby​​前端在字符串的开头使用通配符来搜索它。到目前为止,我一直这样做:SELECT*FROMwordsWHEREwordLIKE'_e__o'甚至SELECT*FROMwordsWHEREwordLIKE'____s'我总是知道单词的确切长度,但除了一个字符之外的所有字符都可能是未知的。这比糖蜜慢,比没有前导通配符的类似查询慢大约15倍,因为无法使用该列的索引。我尝试了几种方法来缩小搜索范围。例如,我添加了26个额外的列,其中包含每个单词的单个字母计数,并首先使用这些列来缩小搜索范围。我也试过按

ruby-on-rails - Rails 使用逻辑运算符搜索 ActiveRecord

我想知道在Rails中解析文本查询的最佳方法是什么,以允许用户包含逻辑运算符?我希望用户能够输入其中任何一个,或一些等效的:#searchingpartialtextinemails,justforexample#queryA"jonANDgmail"#=>["jonsmith@gmail.com"]#queryB"jonORgmail"#=>["jonsmith@gmail.com","sarahcalaway@gmail.com"]#queryC"jonANDgmailANDsmith"#=>["jonsmith@gmail.com"]理想情况下,我们可以使用括号来指示操作顺序,从

ruby - Rails PostgreSQL 使用 LIKE 进行不区分大小写的搜索

我的Controller里有这个:Konkurrencer.where("titleLIKE?","%#{params[:q]}%").limit(4)我认为这个查询是区分大小写的。它不应该区分大小写。 最佳答案 您可以使用ILIKE在何处:Konkurrencer.where("titleILIKE?","%#{params[:q]}%").limit(4)来自文档:ThekeywordILIKEcanbeusedinsteadofLIKEtomakethematchcase-insensitiveaccordingtotheac

ruby - Ruby 中的 p 方法很难搜索

我正在尝试查找有关Ruby中的p方法的信息。它似乎产生了关于类属性的内部信息,但是当我尝试搜索它时,我得到了其中包含字母“p”的每个单词。 最佳答案 您看过api文档页面吗?http://www.ruby-doc.org/core/Kernel.html#method-i-p还有http://apidock.com/ruby/Kernel/p 关于ruby-Ruby中的p方法很难搜索,我们在StackOverflow上找到一个类似的问题: https://st