关闭。这个问题需要更多focused.它目前不接受答案。想改进这个问题吗?更新问题,使其只关注一个问题editingthispost.关闭4年前。Improvethisquestion我一直在阅读有关使用Solr和Mahout开发推荐系统的内容。据我了解,它们处理两个不同的问题。由于Solr是一个搜索引擎+分类系统,因此它主要用于“更像这样”之类的推荐在Drupal中-http://jamidwyer.com/d7/node/21.(或StackOverflow中的“相关”功能)就Mahout而言,它实现了协同过滤等机器学习算法。它可用于根据用户之前的操作(喜欢、购买的商品)在亚马逊中
假设我有一个名为price的字段用于Solr中的文档,并且我对该字段进行了分面。我想将构面作为值的范围(例如:0-100、100-500、500-1000等)。怎么做?我可以预先指定范围,但我也想知道是否可以根据文档中的值自动计算范围(比如5个值)? 最佳答案 要回答您的第一个问题,您可以使用通用方面查询支持来获取方面范围。Here的一个例子:http://localhost:8983/solr/select?q=video&rows=0&facet=true&facet.query=price:[*+TO+500]&facet.q
所以我有一个作为Chef服务器的一部分运行的solr服务器。我的一些节点只是没有出现在搜索中。我可以使用?q=*:*来显示文档,但是大部分Chef数据都被索引为dynamicFields,所以我在xml文档中看不到它。我希望如果我能找到一种方法来查看:什么是solr的索引或带动态字段的完整索引文档集提前致谢! 最佳答案 Luke可能会提供帮助:https://github.com/DmitryKey/luke.您可以将它指向Solr索引并查看其中的内容。上次我检查过,您可以直接从Web运行它,只需将它指向索引即可。
我们正在使用ApacheSolr(3.1.0)为为多个站点编写的大量文章编制索引。我们有一个主/从设置(底部的复制配置),其中服务器1索引文章,服务器2复制索引。从站应该每60秒轮询一次主站,但相反,我们几乎每次都可以看到10到最多75个连续的/replication调用。每个Solr核心(从配置中的${solr.core.name})代表不同的站点。我看到最多的/replication调用与最大的站点相关联。其中一个核心每分钟只有1个调用,在调用update?commit=true几次后我已经能够在那里重现这个,所以这让我认为它与数量有关主人执行的提交。所以我的问题是,如何阻止Sol
我在使用solr作为后端的项目中使用haystack。我希望能够执行包含搜索,类似于Django.filter(something__contains="...")__startswith选项不适合我们的需要,因为顾名思义,它会查找以字符串开头的单词。我尝试使用类似*keyword*的东西,但Solr不允许*用作第一个字符谢谢。 最佳答案 要获得“包含”功能,您可以使用:作为索引分析器。这将为您领域中的每个空格分隔的单词创建ngram。例如:"Indexthis!"=>x,ex,dex,ndex,index,!,s!,is!,his
按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visitthehelpcenter指导。关闭10年前。我是一家初创公司的编码新手,我正在Web主机的目录中实现文档搜索。我正在比较Lucene/Solr、Whoosh、Sphinx和Xapian。Whoosh本身就是Python。但我也想听听你的意见。其中哪些有成熟且易于使用和安装的python接口(interface)?(嗖嗖声是显而易见的)不会出现崩溃、瓶颈和其他故障最佳文档界面(我不阅读PHP文档,因
这是堆栈跟踪:Traceback(mostrecentcalllast):File"manage.py",line10,inexecute_from_command_line(sys.argv)File"/Library/Python/2.7/site-packages/django/core/management/__init__.py",line399,inexecute_from_command_lineutility.execute()File"/Library/Python/2.7/site-packages/django/core/management/__init__.p
我想在Python中使用LuceneSolr。似乎有多个用于此目的的API。他们似乎遇到了依赖hell和稳定性问题,而且Solr不再附带python绑定(bind)。而且我无法为不熟悉Solr的用户找到任何文档。我认为Sunburnt比pysolr和solrpy更成熟。我的评价正确吗?请为Solr推荐稳定的python绑定(bind)以及良好的独立(不预设Solr知识)文档。还是我应该学习如何与“servlet”交互并利用现有文档? 最佳答案 始终独立于任何客户端库(如Sunburnt、pysolr、solrpy等)了解Solr。就
我正在构建一个日志查看实用程序,它将处理TB日志中的实时搜索。我决定将日志存储在Solr中并将其用作搜索引擎。我将在我的项目中使用Django作为框架。为了在Django中使用Solr,我看到有haystack。现在我的架构会是这样的。StoreIndexSearchShowLogStream---------------->Solr-------->Haystack------>Django我的日志是普通的linux服务器日志,如网络、操作、错误等。Syslog正在发送日志。我将允许基于所有日志行进行过滤。我将允许按列排序,例如:ip列、日期列等。示例日志:Dec1113:24:03
我正在构建一个日志查看实用程序,它将处理TB日志中的实时搜索。我决定将日志存储在Solr中并将其用作搜索引擎。我将在我的项目中使用Django作为框架。为了在Django中使用Solr,我看到有haystack。现在我的架构会是这样的。StoreIndexSearchShowLogStream---------------->Solr-------->Haystack------>Django我的日志是普通的linux服务器日志,如网络、操作、错误等。Syslog正在发送日志。我将允许基于所有日志行进行过滤。我将允许按列排序,例如:ip列、日期列等。示例日志:Dec1113:24:03