草庐IT

Damerau-Levenshtein

全部标签

ruby-on-rails - 如何在 sqlite where 子句中使用 Levenshtein 距离函数?

我正在尝试实现“您的意思是?”某种搜索功能。我正在尝试执行一个使用levenshtein函数的查询,该函数是用ruby​​编写的。我想知道如何在sqlite3查询中使用此函数。我在想它可能是这样的:@results=the_db.where('levenshtein(name,?)但我不确定如何让它工作。有人可以帮帮我吗? 最佳答案 试试editdist3函数:Theeditdist3algorithmisafunctionthatcomputestheminimumeditdistance(a.k.a.theLevenshtein

c++ - 如何确定普通话字符的 Levenshtein 距离?

我们正在开发一个系统,使用UTF-8、UTF-16和UTF-32Unicode字符标准对50多种国际语言进行模糊匹配。到目前为止,我们已经能够使用Levenshtein距离来检测德语Unicode扩展字符单词的拼写错误。我们想扩展这个系统来处理以Unicode表示的普通话中文表意文字。我们将如何进行相似汉字之间的Levenshtein距离计算? 最佳答案 首先,澄清一下:汉字并不等同于德语或英语字.大多数你认为是词的东西(使用“词”的语义或句法定义)由1-3个字符组成。通过将这些字符序列表示为UCS-2或UCS-4代码点序列,可以直

c++ - 如何确定普通话字符的 Levenshtein 距离?

我们正在开发一个系统,使用UTF-8、UTF-16和UTF-32Unicode字符标准对50多种国际语言进行模糊匹配。到目前为止,我们已经能够使用Levenshtein距离来检测德语Unicode扩展字符单词的拼写错误。我们想扩展这个系统来处理以Unicode表示的普通话中文表意文字。我们将如何进行相似汉字之间的Levenshtein距离计算? 最佳答案 首先,澄清一下:汉字并不等同于德语或英语字.大多数你认为是词的东西(使用“词”的语义或句法定义)由1-3个字符组成。通过将这些字符序列表示为UCS-2或UCS-4代码点序列,可以直

python - 如何计算 python-Levenshtein.ratio

根据python-Levenshtein.ratio来源:https://github.com/miohtama/python-Levenshtein/blob/master/Levenshtein.c#L722它被计算为(lensum-ldist)/lensum。这适用于#pipinstallpython-LevenshteinimportLevenshteinLevenshtein.distance('ab','a')#returns1Levenshtein.ratio('ab','a')#returns0.666666然而,它似乎打破了Levenshtein.distance('

python - 如何计算 python-Levenshtein.ratio

根据python-Levenshtein.ratio来源:https://github.com/miohtama/python-Levenshtein/blob/master/Levenshtein.c#L722它被计算为(lensum-ldist)/lensum。这适用于#pipinstallpython-LevenshteinimportLevenshteinLevenshtein.distance('ab','a')#returns1Levenshtein.ratio('ab','a')#returns0.666666然而,它似乎打破了Levenshtein.distance('

java - 相似度得分 - Levenshtein

我用Java实现了Levenshtein算法,现在我得到了算法所做的更正,也就是成本。这确实有一点帮助,但没有多大帮助,因为我希望将结果作为百分比。所以我想知道如何计算那些相似点。我也想知道你们是如何做到的以及为什么这样做。 最佳答案 TheLevenshteindistancebetweentwostringsisdefinedastheminimumnumberofeditsneededtotransformonestringintotheother,withtheallowableeditoperationsbeinginse

java - 相似度得分 - Levenshtein

我用Java实现了Levenshtein算法,现在我得到了算法所做的更正,也就是成本。这确实有一点帮助,但没有多大帮助,因为我希望将结果作为百分比。所以我想知道如何计算那些相似点。我也想知道你们是如何做到的以及为什么这样做。 最佳答案 TheLevenshteindistancebetweentwostringsisdefinedastheminimumnumberofeditsneededtotransformonestringintotheother,withtheallowableeditoperationsbeinginse

java - 在 Java 中使用 Levenshtein 距离改进搜索结果

我有以下工作Java代码,用于在单词列表中搜索单词,它可以完美地按预期工作:publicclassLevenshtein{privateint[][]wordMartix;publicSetsimilarExists(StringsearchWord){intmaxDistance=searchWord.length();intcurDistance;intsumCurMax;StringcheckWord;//preventingdoublewordsonreturninglistSetfuzzyWordList=newHashSet();for(ObjectwordList:Sea

java - 在 Java 中使用 Levenshtein 距离改进搜索结果

我有以下工作Java代码,用于在单词列表中搜索单词,它可以完美地按预期工作:publicclassLevenshtein{privateint[][]wordMartix;publicSetsimilarExists(StringsearchWord){intmaxDistance=searchWord.length();intcurDistance;intsumCurMax;StringcheckWord;//preventingdoublewordsonreturninglistSetfuzzyWordList=newHashSet();for(ObjectwordList:Sea

java - Android 和模糊匹配、n-gram 和 Levenshtein 距离

我正在构建一个Android应用程序,它接受一个字符串输入并使用GoogleAPI返回一个图书排名列表。我正在寻找一种方法来将用户输入的开放式字符串与列表中的第一项进行比较,以查看他们输入的内容是否“可能”是一本书。我有大量关于这本书、书名、作者、描述等的信息,所以我可以在任何部分进行搜索。一个例子是:'eyreaffairfforde','ffordeeyreaffair','theeyreaffair'---->'Likely'tobe'TheEyreAffairbyJasperFforde'解决此问题的最佳方法是什么?我看过levenshtein距离,但认为它不适用于这种开放式输