SOLR_草庐IT

java - 使用 Solr 和 Mahout 的推荐系统

关闭。这个问题需要更多focused.它目前不接受答案。想改进这个问题吗？更新问题，使其只关注一个问题editingthispost.关闭4年前。Improvethisquestion我一直在阅读有关使用Solr和Mahout开发推荐系统的内容。据我了解，它们处理两个不同的问题。由于Solr是一个搜索引擎+分类系统，因此它主要用于“更像这样”之类的推荐在Drupal中-http://jamidwyer.com/d7/node/21.(或StackOverflow中的“相关”功能)就Mahout而言，它实现了协同过滤等机器学习算法。它可用于根据用户之前的操作(喜欢、购买的商品)在亚马逊中

java - 如何在 solr 结果中获取构面范围？

假设我有一个名为price的字段用于Solr中的文档，并且我对该字段进行了分面。我想将构面作为值的范围(例如:0-100、100-500、500-1000等)。怎么做？我可以预先指定范围，但我也想知道是否可以根据文档中的值自动计算范围(比如5个值)？最佳答案要回答您的第一个问题，您可以使用通用方面查询支持来获取方面范围。Here的一个例子:http://localhost:8983/solr/select?q=video&rows=0&facet=true&facet.query=price:[*+TO+500]&facet.q

何在 java section web https lucene solr

java - 如何查看 solr 索引的所有数据？

所以我有一个作为Chef服务器的一部分运行的solr服务器。我的一些节点只是没有出现在搜索中。我可以使用?q=*:*来显示文档，但是大部分Chef数据都被索引为dynamicFields，所以我在xml文档中看不到它。我希望如果我能找到一种方法来查看:什么是solr的索引或带动态字段的完整索引文档集提前致谢! 最佳答案 Luke可能会提供帮助:https://github.com/DmitryKey/luke.您可以将它指向Solr索引并查看其中的内容。上次我检查过，您可以直接从Web运行它，只需将它指向索引即可。

java solr section https stackoverflow chef-infra

java - Apache Solr : Slave replicates 10+ times every time it polls (excessive commits? )

我们正在使用ApacheSolr(3.1.0)为为多个站点编写的大量文章编制索引。我们有一个主/从设置(底部的复制配置)，其中服务器1索引文章，服务器2复制索引。从站应该每60秒轮询一次主站，但相反，我们几乎每次都可以看到10到最多75个连续的/replication调用。每个Solr核心(从配置中的${solr.core.name})代表不同的站点。我看到最多的/replication调用与最大的站点相关联。其中一个核心每分钟只有1个调用，在调用update?commit=true几次后我已经能够在那里重现这个，所以这让我认为它与数量有关主人执行的提交。所以我的问题是，如何阻止Sol

replicates excessive code section 34 java solr replication master-slave

python - Django-Haystack with Solr 包含搜索

我在使用solr作为后端的项目中使用haystack。我希望能够执行包含搜索，类似于Django.filter(something__contains="...")__startswith选项不适合我们的需要，因为顾名思义，它会查找以字符串开头的单词。我尝试使用类似*keyword*的东西，但Solr不允许*用作第一个字符谢谢。最佳答案要获得“包含”功能，您可以使用:作为索引分析器。这将为您领域中的每个空格分隔的单词创建ngram。例如:"Indexthis!"=>x,ex,dex,ndex,index,!,s!,is!,his

Django-Haystack Haystack code section 34 python django solr

python - 在 Lucene/Solr、Whoosh、Sphinx、Xapian 中，哪个与 Python 集成得最好？

按照目前的情况，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visitthehelpcenter指导。关闭10年前。我是一家初创公司的编码新手，我正在Web主机的目录中实现文档搜索。我正在比较Lucene/Solr、Whoosh、Sphinx和Xapian。Whoosh本身就是Python。但我也想听听你的意见。其中哪些有成熟且易于使用和安装的python接口(interface)？(嗖嗖声是显而易见的)不会出现崩溃、瓶颈和其他故障最佳文档界面(我不阅读PHP文档，因

python Lucene section notice li solr full-text-search sphinx whoosh

python manage.py build_solr_schema 给出 ImportError : No module named markup

这是堆栈跟踪:Traceback(mostrecentcalllast):File"manage.py",line10,inexecute_from_command_line(sys.argv)File"/Library/Python/2.7/site-packages/django/core/management/__init__.py",line399,inexecute_from_command_lineutility.execute()File"/Library/Python/2.7/site-packages/django/core/management/__init__.p

build_solr_schema ImportError framework pyobjc django python solr

python - Solr:最好的记录、易于使用、稳定的 Python API

我想在Python中使用LuceneSolr。似乎有多个用于此目的的API。他们似乎遇到了依赖hell和稳定性问题，而且Solr不再附带python绑定(bind)。而且我无法为不熟悉Solr的用户找到任何文档。我认为Sunburnt比pysolr和solrpy更成熟。我的评价正确吗？请为Solr推荐稳定的python绑定(bind)以及良好的独立(不预设Solr知识)文档。还是我应该学习如何与“servlet”交互并利用现有文档？最佳答案始终独立于任何客户端库(如Sunburnt、pysolr、solrpy等)了解Solr。就

易于 python section strong Solr

Django、Haystack、Solr、MongoDB 架构决策

我正在构建一个日志查看实用程序，它将处理TB日志中的实时搜索。我决定将日志存储在Solr中并将其用作搜索引擎。我将在我的项目中使用Django作为框架。为了在Django中使用Solr，我看到有haystack。现在我的架构会是这样的。StoreIndexSearchShowLogStream---------------->Solr-------->Haystack------>Django我的日志是普通的linux服务器日志，如网络、操作、错误等。Syslog正在发送日志。我将允许基于所有日志行进行过滤。我将允许按列排序，例如:ip列、日期列等。示例日志:Dec1113:24:03

Haystack MongoDB section Django strong logging solr django-haystack

Django、Haystack、Solr、MongoDB 架构决策

我正在构建一个日志查看实用程序，它将处理TB日志中的实时搜索。我决定将日志存储在Solr中并将其用作搜索引擎。我将在我的项目中使用Django作为框架。为了在Django中使用Solr，我看到有haystack。现在我的架构会是这样的。StoreIndexSearchShowLogStream---------------->Solr-------->Haystack------>Django我的日志是普通的linux服务器日志，如网络、操作、错误等。Syslog正在发送日志。我将允许基于所有日志行进行过滤。我将允许按列排序，例如:ip列、日期列等。示例日志:Dec1113:24:03

Haystack MongoDB section Django strong logging solr django-haystack