我想在Ruby中比较两个字符串并找出它们的相似性我看过Levenshteingem,但它似乎是2008年的最后一次更新,我找不到如何使用它的文档。一些博客暗示它坏了我用Levenshtein尝试了textgem,但它给出了一个整数(越小越好)显然,如果这两个字符串的长度可变,我会遇到Levenshtein算法的问题(比方说比较两个名字,其中一个有中间名而另一个没有)。您建议我如何进行百分比比较?编辑:我正在寻找类似于PHP的similartext的东西 最佳答案 我认为您的问题可以做一些澄清,但这里有一些快速而肮脏的东西(根据您上面
我可以用Ruby测量两个字符串之间的距离吗?即:compare('Test','est')#Returns1compare('Test','Tes')#Returns1compare('Test','Tast')#Returns1compare('Test','Taste')#Returns2compare('Test','tazT')#Returns5 最佳答案 由于原生C绑定(bind),更加容易和快速:geminstalllevenshtein-ffigeminstalllevenshteinrequire'levenshte
我想运行Levenshtein,但要快得多,因为它是我正在构建的实时应用程序。一旦距离大于10,它就会终止。 最佳答案 从评论来看,人们似乎对Sift3很满意.http://sift.codeplex.com 关于javascript-对于字符串距离,是否有比Levenshtein更快(不太精确)的算法?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/6178708/
这个问题在这里已经有了答案:Sortanarraybythe"LevenshteinDistance"withbestperformanceinJavascript(7个答案)关闭9年前。对于客户端搜索工具,我需要找到一个词与数百万个其他词的Levenshtein距离。用户应该能够将大约二十个单词的短文本与一本书进行比较。用户可以通过查找书中文本中最具特征的单词的位置来做到这一点。“查找位置”并不意味着寻找完全匹配,而是与levenshtein几乎匹配。我从已经可用的实现开始,但我需要更快的速度。我最终得到了这个:varrowA=newUint16Array(1e6);varrowB=
Closed.Thisquestionneedstobemorefocused。它当前不接受答案。想改善这个问题吗?更新问题,使其仅关注editingthispost一个问题。去年关闭。Improvethisquestion我正在尝试寻找一种最佳方法,将一个文本(最大长度:300)与Levenshtein的300.000进行比较。最后,我需要一个带有简单RESTAPI的Web服务。将来,条目数将超过300.000。在后台,我正在使用一个简单的MySQL数据库。我的第一个想法是使用MySQL来完成这项工作。为此,我找到了这个:https://github.com/juanmirocks/
Python+Sqlite中是否有可用的字符串相似性度量,例如sqlite3模块?用例示例:importsqlite3conn=sqlite3.connect(':memory:')c=conn.cursor()c.execute('CREATETABLEmytable(idinteger,descriptiontext)')c.execute('INSERTINTOmytableVALUES(1,"helloworld,guys")')c.execute('INSERTINTOmytableVALUES(2,"hellothereeverybody")')此查询应匹配ID为1的行,但
我目前正在从事一个项目,需要我将我们的乐队和field数据库与许多外部服务相匹配。基本上,我正在寻找确定两个名称是否相同的最佳方法的方向。例如:我们的数据库地点名称-“ThePigandWhiSTLe”服务1-“pig和哨子”服务2-“pig与口哨”等等等等我认为主要区别在于缺少“the”或使用“&”而不是“and”,但也可能存在拼写略有不同和单词顺序不同等问题。在这种情况下通常使用哪些算法/技术,我是否需要过滤噪音词或进行某种拼写检查类型匹配?您在C#中看到过类似的示例吗?更新:如果有人对C#示例感兴趣,可以通过执行googlecodesearchforLevenshteindist
C#是否有自己的模糊匹配(模糊搜索)库或可以直接从.net库中使用的方法? 最佳答案 不是图书馆,但请查看Levenshtein编辑距离算法:http://en.wikipedia.org/wiki/Levenshtein_distance它在模糊匹配文本方面广为人知、成熟且出色。除了我提供的链接之外还有许多其他示例,以防它不适合您:GoogleSearch 关于c#-C#中的模糊匹配,我们在StackOverflow上找到一个类似的问题: https://s
我在为.net寻找最接近匹配字符串的实现时遇到问题我想匹配一个字符串列表,例如:输入字符串:“PublicznaSzkołaPodstawowaim.BolesławaChrobregowąsoszu”字符串列表:PublicznaSzkołaPodstawowaim。B.ChrobregowąsoszuSzkołaPodstawowaSpecjalnaSzkołaPodstawowaim.HenrykaSienkiewicza和WąsoszuSzkołaPodstawowaim。RomualdaTrauguttawąsoszuGórnym这显然需要与“PublicznaSzkołaP
进一步解释假设我有如下两个字符串IamasuperboywhocanFly!Really.IamsuperboywhocanBreakwalls!Really.所以有些角色很相似Iamsuperboywhocan和Really.。有没有现成的东西可以用来查找这两个字符串之间的百分比相似度/差异度。 最佳答案 您应该查看Levenshtein距离。http://en.wikipedia.org/wiki/Levenshtein_distance 关于php-如何计算两个文本/字符串之间的相