草庐IT

Damerau-Levenshtein

全部标签

python - 如何在 OSX 上导入和使用 python Levenshtein 扩展?

我已经下载了python-Levenshtein存档并提取了Levenshtein目录。所以,结果我有以下文件结构:Levenshtein-__init__.py-_levenshtein.c-_levenshtein.h-StringMatcher.pymyscript.py以及以下myscript.py内容:fromLevenshteinimport*fromwarningsimportwarnprintLevenshtein.distance(string1,string2)但我收到以下错误-Traceback(mostrecentcalllast):File"myscript.

python - 如何加快 Levenshtein 距离计算

我正在尝试运行模拟来测试平均值Levenshteindistance随机之间二进制字符串。我的程序是用python编写的,但我正在使用这个Cextension.相关且花费大部分时间的函数计算两个字符串之间的Levenshtein距离,就是这个。lev_edit_distance(size_tlen1,constlev_byte*string1,size_tlen2,constlev_byte*string2,intxcost){size_ti;size_t*row;/*weonlyneedtokeeponerowofcosts*/size_t*end;size_thalf;/*stri

python - 编辑距离,例如 Levenshtein 考虑到键盘上的接近度

是否有像Levenshtein这样考虑替换距离的编辑距离?例如,如果我们考虑单词是否相等,typo和tylo非常接近(p和l在键盘上物理距离很近),而typo和tyqo相距很远。我想为更可能出现的拼写错误分配更小的距离。必须有一个指标来考虑这种邻近性吗? 最佳答案 你问的那种距离不包括在levenshtein-但你应该使用像欧几里德或曼哈顿距离这样的助手来获得结果。我的简单假设是,q(英文qwerty布局)是笛卡尔坐标(y=0;x=0)所以,w将是(y=0;x=1)等等。wholelistherekeyboard_cartesian

ios - Levenshtein 距离算法优于 O(n*m)?

我一直在寻找一种先进的编辑距离算法,并且thebestIhavefoundsofar是O(n*m),其中n和m是两个字符串的长度。该算法采用这种规模的原因是因为空间,而不是时间,创建了两个字符串的矩阵,例如这个:是否有比O(n*m)更好的公开可用的levenshtein算法?我不反对查看高级计算机科学论文和研究,但一直无法找到任何东西。我找到了一家公司,Exorbyte,据说它已经建立了一个super先进和super快速的Levenshtein算法,但这当然是商业secret。我正在构建一个iPhone应用程序,我想使用Levenshtein距离计算。Thereisanobjectiv

javascript - 按 "Levenshtein Distance"对数组进行排序,在 Javascript 中性能最佳

所以我有一个随机的javascript名称数组...[@larry,@nicholas,@notch]等它们都以@符号开头。我想按Levenshtein距离对它们进行排序,以便列表顶部的那些最接近搜索词。目前,我有一些javascript使用jQuery的.grep()使用javascript.match()方法围绕按键输入的搜索词:(自首次发布后编辑的代码)limitArr=$.grep(imTheCallback,function(n){returnn.match(searchy.toLowerCase())});modArr=limitArr.sort(levenshtein(s

python - sudo pip install python-Levenshtein 失败,错误代码为 1

我正在尝试在linux上安装python-Levenshtein库,但每当我尝试通过以下方式安装它时:sudopipinstallpython-Levenshtein我收到这个错误:Command"/usr/bin/python-c"importsetuptools,tokenize;file='/tmp/pip-build-LAmG4b/python-Levenshtein/setup.py';exec(compile(getattr(tokenize,'open',open)(file).read().replace('\r\n','\n'),file,'exec'))"insta

mysql - 如何在 mysql 中添加 levenshtein 函数?

我从http://kristiannissen.wordpress.com/2010/07/08/mysql-levenshtein/获得了MySQL的Levenshtein距离的代码。(archive.org链接),但是如何在MySQL中添加该功能?我正在使用XAMPP,我需要它在PHP中进行搜索。 最佳答案 我已连接到我的MySQL服务器并简单地执行了thisstatement在MySQLWorkbench,而且它很简单——我现在有了新函数levenshtein()。例如,这按预期工作:SELECTlevenshtein('ab

python - 在哪里可以在线找到 python-Levenshtein 的文档?

已结束。此问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提出有关书籍、工具、软件库等方面的建议的问题。您可以编辑问题,以便用事实和引用来回答它。关闭4年前。Improvethisquestion我在http://code.google.com/p/pylevenshtein/找到了一个很棒的Python库,它实现了Levenshtein函数(距离、比率等)。但该项目似乎不活跃,文档无处可寻。我想知道是否有人比我更了解并可以指出我的文档。 最佳答案 这是一个例子:#installwith:pip

python - Python 中的高性能模糊字符串比较,使用 Levenshtein 或 difflib

关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题吗?更新问题,以便editingthispost提供事实和引用来回答它.关闭7年前。Improvethisquestion我正在进行临床信息规范化(拼写检查),其中我将每个给定的单词与900,000个单词的医学词典进行核对。我更关心时间复杂度/性能。我想做模糊字符串比较,但不确定使用哪个库。选项1:importLevenshteinLevenshtein.ratio('helloworld','hello')Result:0.625选项2:importdifflibdifflib.SequenceMatche

java - 实现一个简单的 Trie 以进行高效的 Levenshtein 距离计算 - Java

更新3完毕。下面是最终通过我所有测试的代码。同样,这是在MuriloVasconcelo的SteveHanov算法的修改版本之后建模的。感谢所有帮助过的人!/***ComputestheminimumLevenshteinDistancebetweenthegivenword(representedasanarrayofCharacters)andthe*wordsstoredintheTrie.ThisalgorithmismodeledafterSteveHanov'sblogarticle"FastandEasyLevenshtein*distanceusingaTrie"and