草庐IT

Levenshtein

全部标签

ruby-on-rails - 如何在 sqlite where 子句中使用 Levenshtein 距离函数?

我正在尝试实现“您的意思是?”某种搜索功能。我正在尝试执行一个使用levenshtein函数的查询,该函数是用ruby​​编写的。我想知道如何在sqlite3查询中使用此函数。我在想它可能是这样的:@results=the_db.where('levenshtein(name,?)但我不确定如何让它工作。有人可以帮帮我吗? 最佳答案 试试editdist3函数:Theeditdist3algorithmisafunctionthatcomputestheminimumeditdistance(a.k.a.theLevenshtein

c# - 用于文本算法的 .NET 库?

您知道任何用于文本算法的.NET库吗?我尤其对字符串匹配和全文搜索算法感兴趣,例如Bitap算法编辑距离Damerau–Levenshtein距离我知道我提到的那个编码起来很简单,但是有数百种文本算法,我不想一个人全部编码。如果没有已知的.NET库,您可以提及C、C++库,编码包装器将比从零开始编码更容易。 最佳答案 您可能有兴趣查看google-diff-match-patchGoogleCode上的图书馆。他们实现了Myer的diff算法,并声称还“在核心”实现了Bitap算法。它包含您正在寻找的C#源代码以及Java、C++、

c# - 用于文本算法的 .NET 库?

您知道任何用于文本算法的.NET库吗?我尤其对字符串匹配和全文搜索算法感兴趣,例如Bitap算法编辑距离Damerau–Levenshtein距离我知道我提到的那个编码起来很简单,但是有数百种文本算法,我不想一个人全部编码。如果没有已知的.NET库,您可以提及C、C++库,编码包装器将比从零开始编码更容易。 最佳答案 您可能有兴趣查看google-diff-match-patchGoogleCode上的图书馆。他们实现了Myer的diff算法,并声称还“在核心”实现了Bitap算法。它包含您正在寻找的C#源代码以及Java、C++、

c++ - 如何确定普通话字符的 Levenshtein 距离?

我们正在开发一个系统,使用UTF-8、UTF-16和UTF-32Unicode字符标准对50多种国际语言进行模糊匹配。到目前为止,我们已经能够使用Levenshtein距离来检测德语Unicode扩展字符单词的拼写错误。我们想扩展这个系统来处理以Unicode表示的普通话中文表意文字。我们将如何进行相似汉字之间的Levenshtein距离计算? 最佳答案 首先,澄清一下:汉字并不等同于德语或英语字.大多数你认为是词的东西(使用“词”的语义或句法定义)由1-3个字符组成。通过将这些字符序列表示为UCS-2或UCS-4代码点序列,可以直

c++ - 如何确定普通话字符的 Levenshtein 距离?

我们正在开发一个系统,使用UTF-8、UTF-16和UTF-32Unicode字符标准对50多种国际语言进行模糊匹配。到目前为止,我们已经能够使用Levenshtein距离来检测德语Unicode扩展字符单词的拼写错误。我们想扩展这个系统来处理以Unicode表示的普通话中文表意文字。我们将如何进行相似汉字之间的Levenshtein距离计算? 最佳答案 首先,澄清一下:汉字并不等同于德语或英语字.大多数你认为是词的东西(使用“词”的语义或句法定义)由1-3个字符组成。通过将这些字符序列表示为UCS-2或UCS-4代码点序列,可以直

c++ - 字符串与最相似的字符串比较

有谁知道是否存在一种算法,给定一个字符串A和一个字符串数组B,将A字符串与B中的所有字符串进行比较,输出最相似的字符串。对于“最相似的”,我的意思是,例如,如果A字符串是:“helloworldhowareyou”然后“asdfasdewr你好,asfrqr你好”比:“h2ll4w1111h11111111” 最佳答案 通常的度量是Levenshteindistance.计算从原始到每个候选者的Levenshtein距离,并取最小的距离作为最可能的候选者。 关于c++-字符串与最相似的字

c++ - 字符串与最相似的字符串比较

有谁知道是否存在一种算法,给定一个字符串A和一个字符串数组B,将A字符串与B中的所有字符串进行比较,输出最相似的字符串。对于“最相似的”,我的意思是,例如,如果A字符串是:“helloworldhowareyou”然后“asdfasdewr你好,asfrqr你好”比:“h2ll4w1111h11111111” 最佳答案 通常的度量是Levenshteindistance.计算从原始到每个候选者的Levenshtein距离,并取最小的距离作为最可能的候选者。 关于c++-字符串与最相似的字

python - 如何计算 python-Levenshtein.ratio

根据python-Levenshtein.ratio来源:https://github.com/miohtama/python-Levenshtein/blob/master/Levenshtein.c#L722它被计算为(lensum-ldist)/lensum。这适用于#pipinstallpython-LevenshteinimportLevenshteinLevenshtein.distance('ab','a')#returns1Levenshtein.ratio('ab','a')#returns0.666666然而,它似乎打破了Levenshtein.distance('

python - 如何计算 python-Levenshtein.ratio

根据python-Levenshtein.ratio来源:https://github.com/miohtama/python-Levenshtein/blob/master/Levenshtein.c#L722它被计算为(lensum-ldist)/lensum。这适用于#pipinstallpython-LevenshteinimportLevenshteinLevenshtein.distance('ab','a')#returns1Levenshtein.ratio('ab','a')#returns0.666666然而,它似乎打破了Levenshtein.distance('

python - "' cc ' failed with exit status 1"安装python库时出错

与许多其他人一样,我在安装python库时遇到问题(下载为tar,然后解压缩)。rodolphe-mbp:python-Levenshtein-0.11.2Rodolphe$sudopythonsetup.pyinstallrunninginstallrunningbdist_eggrunningegg_infowritingrequirementstopython_Levenshtein.egg-info/requires.txtwritingpython_Levenshtein.egg-info/PKG-INFOwritingnamespace_packagestopython_L