草庐IT

Similarity

全部标签

c# - 比较具有公差的字符串

我正在寻找一种方法来比较一个字符串和一个字符串数组。进行精确搜索当然很容易,但我希望我的程序能够容忍拼写错误、字符串的缺失部分等。是否有某种框架可以执行这样的搜索?我的想法是,搜索算法将按匹配百分比或类似的顺序返回一些结果。 最佳答案 您可以使用LevenshteinDistancealgorithm.“两个字符串之间的编辑距离定义为将一个字符串转换为另一个字符串所需的最小编辑次数,允许的编辑操作是插入、删除或替换单个字符。”-Wikipedia.com这个来自dotnetperls.com:usingSystem;//////Co

c# - 比较具有公差的字符串

我正在寻找一种方法来比较一个字符串和一个字符串数组。进行精确搜索当然很容易,但我希望我的程序能够容忍拼写错误、字符串的缺失部分等。是否有某种框架可以执行这样的搜索?我的想法是,搜索算法将按匹配百分比或类似的顺序返回一些结果。 最佳答案 您可以使用LevenshteinDistancealgorithm.“两个字符串之间的编辑距离定义为将一个字符串转换为另一个字符串所需的最小编辑次数,允许的编辑操作是插入、删除或替换单个字符。”-Wikipedia.com这个来自dotnetperls.com:usingSystem;//////Co

论文阅读+实战:SimGNN:A Neural Network Approach to Fast Graph Similarity Computation

Part1:论文阅读论文链接:SimGNN:ANeuralNetworkApproachtoFastGraphSimilarityComputation1.摘要图相似性搜索是最重要的基于图的应用程序之一,例如查找与查询化合物最相似的化合物。图相似度/距离计算,例如图编辑距离(GED)和最大公共子图(MCS),是图相似度搜索和许多其他应用程序的核心操作,但在实践中计算成本很高。作者受最近神经网络方法在几种图应用(例如节点或图分类)中取得成功的启发,提出了一种基于神经网络的新方法来解决这个经典但具有挑战性的图问题,旨在减轻计算负担的同时保持良好的性能。2.论文提出背景图相似性搜索是最重要的基于图的

php - 如何在 PHP 中为拼写错误的单词找到相似的单词?

我会解释我的问题:我有一个名为country的数据库表。它有两列:ID和name。当我想搜索'paris',但拼错了单词:'pares'('e'而不是'i'),我不会从DB得到任何结果。我希望系统建议可以帮助搜索的相似词。因此,我正在寻求帮助来编写一个脚本,该脚本从包含类似词的数据库中提出建议,例如:paris、paredes等。 最佳答案 在PHP中你应该使用metaphone它比soundex更准确.但是您的问题是从数据库中获取数据。你没有提到数据库。在MySQL中,您可以使用SOUNDEX功能。您只需要更改查询中的where子

php - 如何在 PHP 中为拼写错误的单词找到相似的单词?

我会解释我的问题:我有一个名为country的数据库表。它有两列:ID和name。当我想搜索'paris',但拼错了单词:'pares'('e'而不是'i'),我不会从DB得到任何结果。我希望系统建议可以帮助搜索的相似词。因此,我正在寻求帮助来编写一个脚本,该脚本从包含类似词的数据库中提出建议,例如:paris、paredes等。 最佳答案 在PHP中你应该使用metaphone它比soundex更准确.但是您的问题是从数据库中获取数据。你没有提到数据库。在MySQL中,您可以使用SOUNDEX功能。您只需要更改查询中的where子

php - 描述计算文本相似度的 PHP 算法的论文 "Oliver [1993]"是什么?

PHP库中有一个函数similar_text()。文档(http://php.net/manual/en/function.similar-text.php)告诉我“这计算了两个字符串之间的相似性,如Oliver[1993]中所述。”尽管进行了大量搜索,但我找不到“Oliver[1993]”所指的论文;也不是“奥利弗”可能成为谁的任何候选人。PHP源代码未记录。关于Oliver1993的唯一其他引用是在http://www.codeguru.com/forum/showthread.php?t=41089的论坛中。,并且我认为该信息来自PHP文档。有人知道这可能是什么吗?

php - 描述计算文本相似度的 PHP 算法的论文 "Oliver [1993]"是什么?

PHP库中有一个函数similar_text()。文档(http://php.net/manual/en/function.similar-text.php)告诉我“这计算了两个字符串之间的相似性,如Oliver[1993]中所述。”尽管进行了大量搜索,但我找不到“Oliver[1993]”所指的论文;也不是“奥利弗”可能成为谁的任何候选人。PHP源代码未记录。关于Oliver1993的唯一其他引用是在http://www.codeguru.com/forum/showthread.php?t=41089的论坛中。,并且我认为该信息来自PHP文档。有人知道这可能是什么吗?

MySQL查询以在单个列中查找相似的值

我有高度相似但不准确的重复条目。以下是一些示例:-2016:Obama'sAmerica-2016:Obama'sAmerica(VF)-HurtLocker-TheHurtLocker我可以使用什么查询来获得可能相似的titles?更新请注意,我并不是要删除EXACT重复项。我只是想在单个列中选择相似的值。 最佳答案 我认为这可以通过用stringmetric测量字符串之间的距离来解决。.Levenshtein似乎是最著名的指标,我已经在Oracle中使用了它的一些实现。是implementedforMySQL还。您可能会发现其他

MySQL查询以在单个列中查找相似的值

我有高度相似但不准确的重复条目。以下是一些示例:-2016:Obama'sAmerica-2016:Obama'sAmerica(VF)-HurtLocker-TheHurtLocker我可以使用什么查询来获得可能相似的titles?更新请注意,我并不是要删除EXACT重复项。我只是想在单个列中选择相似的值。 最佳答案 我认为这可以通过用stringmetric测量字符串之间的距离来解决。.Levenshtein似乎是最著名的指标,我已经在Oracle中使用了它的一些实现。是implementedforMySQL还。您可能会发现其他

php - Libpuzzle 索引数百万张图片?

它是关于来自Mr.FrankDenis的libpuzzlelibrayforphp(http://libpuzzle.pureftpd.org/project/libpuzzle)。我想了解如何在我的mysql数据库中索引和存储数据。vector的生成是绝对没问题的。例子:#Computesignaturesfortwoimages$cvec1=puzzle_fill_cvec_from_file('img1.jpg');$cvec2=puzzle_fill_cvec_from_file('img2.jpg');#Computethedistancebetweenbothsignatu