我想使用全文搜索引擎,我决定做Sphinx。但我正在使用hadoop和大数据平台,SphinxSearch与无法处理大数据的mysql数据库兼容。那么有没有办法将Sphinx与hadoop或HDFS或任何其他nosql数据库等大数据环境一起使用? 最佳答案 好吧,它带有用于从RDBMS加载数据的内置驱动程序,但当然不限于此。对于初学者来说,有“管道”索引选项...http://sphinxsearch.com/docs/current.html#xmlpipe2http://sphinxsearch.com/docs/current
我正要将基于Sphinx的搜索集成到网站中,但我发现没有内置的拼写更正支持。网上的人建议使用pspell或其他第三方库来完成任务,但问题是我要搜索的数据主要包含品牌名称等“技术”术语,因此我不认为公共(public)图书馆将包括它们。另一方面,Xapian声明支持基于索引数据的拼写更正,这正是我想要的。值得使用Xapian代替吗?我仍然很困惑我应该使用哪个全文搜索引擎:Sphinx似乎相当不错,但缺少Xapian(或者可能是Lucene?)的一些很酷的功能,而后者看起来社区较小且文档较少。我想我可以使用自定义字典解决pspell字典中不存在的单词的问题,但我不确定这是否会造成明显的性能
我的任务是选择我们将在即将开展的项目中使用的全文搜索引擎。根据我读过的内容,我倾向于Solr,但我有点担心空间搜索。除了一些其他参数(关键字、类别等)之外,我们还希望能够指定位置和最大距离(例如,在亚利桑那州坦佩25英里以内)。我们希望能够按距离对结果进行排序。SpatialSOLR显然很新,尚不完全清楚它的成熟度。还有一些其他选项(手动计算然后反转距离,或solr-spatial-light。我的问题基本上是:SpatialSolr(或solr-spatial-light)是否足以在黄金时间处理我上面描述的情况,或者我们最好还是使用Sphinx?我也有兴趣听听实现其中任何一个的一般经
似乎Sphinx正在逐字搜索文档。我不知道如何在文档中搜索确切的短语。我尝试了SPH_MATCH_ALL、SPH_MATCH_PHRASE但都逐字搜索文档。我在我的PHP应用程序中使用它。如何查询Sphinx以匹配精确的字符串?这是我的代码:$sphinx=newSphinxClient();$mode=SPH_MATCH_PHRASE;$sphinx->setServer('127.0.0.1',9312);$sphinx->setLimits(0,1);$sphinx->setMaxQueryTime(5000);$sphinx->setMatchMode($mode);$sphi
我安装了SphinxSearch作为我的搜索引擎,我正在尝试使用setFilter()和SetSelect()为搜索添加一些额外的功能,这应该请允许我执行WHERE/AND子句。但每当我尝试搜索时,它只会返回结果而不返回任何结果。这是我的sphinx.conf:http://pastebin.com/M6Kd71u0这是PHP代码:require("sphinxapi.php");$host="localhost";$port=9312;$index="llgenre";$select1="cartoon";$label6="children";$type=4;$limit=20;$r
我将网站上的全文搜索切换为sphinx。我将使用SphinxSE来执行搜索。我创建了2个索引,如手册中所述:http://www.sphinxsearch.com/docs/manual-0.9.9.html#live-updates它似乎有效,并在其自己的索引中索引不同的内容,但我对如何处理索引更新、合并和重建有些困惑。我的理解是我cron它每5分钟左右运行一次“indexerdelta--rotate”,这会向索引添加新的提交。然后每天一次,我会通过运行“indexermaindelta--rotate”将增量索引合并到主索引中。然后大约一个月一次,我将运行“indexer--al
我想在android中使用sphinx4语音识别。最近我在java中使用sphinx4语音识别并成功实现。但我的问题是pockesphinx是android的语音识别。我无法理解教程。我尝试了很多次运行pocketsphinx但未能成功,因为我不知道Linux命令,我想实现pocketsphinx和eclipseHelios,我的操作系统是windows7。任何人都可以给我一些步骤来实现pocketsphinx与windows7和eclipseforandroid。现在已经两周了,我只是访问教程,但我什么也做不了。所以请。任何人都可以帮助我。或者即使有任何东西可以将我的sphinx4j
已结束。此问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提出有关书籍、工具、软件库等方面的建议的问题。您可以编辑问题,以便用事实和引用来回答它。关闭8个月前。社区审核了是否重新打开此问题8个月前并关闭:原始关闭原因未解决Improvethisquestion我正在构建一个Django站点,我正在寻找一个搜索引擎。一些候选人:Lucene/Lucene与Compass/SolrsphinxPostgresql内置全文搜索MySQl内置全文搜索选择标准:结果相关性和排名搜索和索引速度易于使用且易于与Django集成资源要求-网站将托管在VPS上,因此
已结束。此问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提出有关书籍、工具、软件库等方面的建议的问题。您可以编辑问题,以便用事实和引用来回答它。关闭8个月前。社区审核了是否重新打开此问题8个月前并关闭:原始关闭原因未解决Improvethisquestion我正在构建一个Django站点,我正在寻找一个搜索引擎。一些候选人:Lucene/Lucene与Compass/SolrsphinxPostgresql内置全文搜索MySQl内置全文搜索选择标准:结果相关性和排名搜索和索引速度易于使用且易于与Django集成资源要求-网站将托管在VPS上,因此
我有一个客户需要一个可以识别语音命令的Android应用程序。据我了解,内置的语音转文本功能实际上是将数据发送到谷歌的服务器,然后由谷歌的服务器发回文本翻译。这是一个主要问题,因为语音数据非常敏感(除非数据在与谷歌之间发送和接收时是否加密——但我怀疑它是否加密)。我能想到两个选项。首先是在Android上将语音转换为文本,尽管这似乎是一项非常昂贵的操作。第二种可能性是让本地服务器为我转换数据(我可以加密语音数据和传输时的翻译)。这是CMUSphinx可以实现的吗?可能值得注意的是,我还可以访问Asterisk服务器,这可能会对此有所帮助(我不知道)。实际上,应该只有大约200个单词需要