草庐IT

Damerau-Levenshtein

全部标签

javascript - 对于字符串距离,是否有比 Levenshtein 更快(不太精确)的算法?

我想运行Levenshtein,但要快得多,因为它是我正在构建的实时应用程序。一旦距离大于10,它就会终止。 最佳答案 从评论来看,人们似乎对Sift3很满意.http://sift.codeplex.com 关于javascript-对于字符串距离,是否有比Levenshtein更快(不太精确)的算法?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/6178708/

javascript - 什么是高频使用最快的 levenshtein 算法

这个问题在这里已经有了答案:Sortanarraybythe"LevenshteinDistance"withbestperformanceinJavascript(7个答案)关闭9年前。对于客户端搜索工具,我需要找到一个词与数百万个其他词的Levenshtein距离。用户应该能够将大约二十个单词的短文本与一本书进行比较。用户可以通过查找书中文本中最具特征的单词的位置来做到这一点。“查找位置”并不意味着寻找完全匹配,而是与levenshtein几乎匹配。我从已经可用的实现开始,但我需要更快的速度。我最终得到了这个:varrowA=newUint16Array(1e6);varrowB=

java - 与Levenshtein的快速比较

Closed.Thisquestionneedstobemorefocused。它当前不接受答案。想改善这个问题吗?更新问题,使其仅关注editingthispost一个问题。去年关闭。Improvethisquestion我正在尝试寻找一种最佳方法,将一个文本(最大长度:300)与Levenshtein的300.000进行比较。最后,我需要一个带有简单RESTAPI的Web服务。将来,条目数将超过300.000。在后台,我正在使用一个简单的MySQL数据库。我的第一个想法是使用MySQL来完成这项工作。为此,我找到了这个:https://github.com/juanmirocks/

python - 与 Python + Sqlite 的字符串相似性(Levenshtein 距离/编辑距离)

Python+Sqlite中是否有可用的字符串相似性度量,例如sqlite3模块?用例示例:importsqlite3conn=sqlite3.connect(':memory:')c=conn.cursor()c.execute('CREATETABLEmytable(idinteger,descriptiontext)')c.execute('INSERTINTOmytableVALUES(1,"helloworld,guys")')c.execute('INSERTINTOmytableVALUES(2,"hellothereeverybody")')此查询应匹配ID为1的行,但

php - cost 在 php 的 levenshtein 函数中比较字符串是什么意思?

我正在学习php的levenshteinfunction在小型redis实例中创建搜索以获取匹配项,即使提交的搜索词中存在拼写错误。虽然其中的大部分内容都是不言自明的,但我正在努力了解如何最好地使用三个不同的cost参数。intlevenshtein(string$str1,string$str2,int$cost_ins,int$cost_rep,int$cost_del)文档中有简短的解释Asecondvariantwilltakethreeadditionalparametersthatdefinethecostofinsert,replaceanddeleteoperation

PHP - 优化 - 具有优先级的 Levenshtein 距离

我正在尝试实现levenshteinalgorithm有一个小插件。我想优先考虑具有连续匹配字母的值。我尝试使用以下代码实现我自己的形式:functionlevenshtein_rating($string1,$string2){$GLOBALS['lvn_memo']=array();returnlev($string1,0,strlen($string1),$string2,0,strlen($string2));}functionlev($s1,$s1x,$s1l,$s2,$s2x,$s2l,$cons=0){$key=$s1x.",".$s1l.",".$s2x.",".$s2

java - Levenshtein 到 Damerau-Levenshtein

我坐在这里用Java为我的主程序编写一些算法(这是迄今为止的第一个)。我对levenshtein算法进行了很好的编程,这要归功于wiki对新手的伪代码非常好,还有一个很好的教程:D然后我决定升级到Damerau并添加了额外的行,但后来我读到它不是DL算法而是OptimalStringAlignmentDistance。我尝试阅读actionscript代码以了解我还需要添加什么才能将其添加到DL,但却感到困惑。我去过不同的地方,代码看起来与Java相似,但他们也都使用了错误的伪代码。折腾了半天就放弃了,决定在这里问问。有没有人可以帮助我将此代码升级到Java中的Damerau-Leve

java - Java中Levenshtein算法的问题

我想使用Levenshteinalgorithm对于以下任务:如果我网站上的用户搜索某个值(他在输入中输入字符),我想立即使用AJAX检查建议,就像GoogleInstant一样。我的印象是Levenshtein算法对于这样的任务来说太慢了。为了检查它的行为,我首先用Java实现它,在方法的每次递归调用中打印出两个String。publicclassLevenshtein{publicstaticvoidmain(String[]arg){Stringa="HalloZusammen";Stringb="jfdssZusammen";intres=levenshtein(a,b);Sy

HTML页面比较-Levenshtein距离

我的任务是比较两个HTML页面的内容,就像它们彼此之间有多不同。通过差异,我的意思是两者是不同/相同的W.R.T.divS,imgs,content和其他标签(用户可以在视觉上解释所有差异。例如,如果您要比较两个用于购买产品的HTML页面,因此购买过程有3个步骤。如果我比较step2(信用卡信息)和step3(结帐/确认页)然后,几乎所有页面购买面板外的所有内容都是相同的,但内部所有内容都不同。因此,用户可以在视觉上解释这两个页面都不同)。为此,我使用了Levenshtein距离,代码在下面/***ThemethodlevenshteinDistance()isusetocalculateth

java流和滤清器levenshtein距离

我试图弄清楚使用Java流是否有一种优雅的方法来进行以下操作:获取一个pojos的列表,其中一个字段是字符串(例如姓氏)取一个您想搜索的字符串(例如surnametypedin)找到最小的Levenshtein距离列表中的POJO(我正在使用ApacheCommonsstringutils.getlevenshteindistance)返回整个pojo,而不仅仅是姓氏或距离到目前为止,我能够做到的唯一方法是在每个级别上创建一个中间地图,这效果非常肮脏。是否有一种公认的方法来实现自定义收藏家或类似的方法?看答案只需创建一个即可Comparator:Comparatorcomparator=Com