LUCENE_草庐IT

Lucene 索引 : Store and indexing modes explained

我想我还是不理解lucene索引选项。下面的选项是Store.YesStore.No和Index.TokenizedIndex.Un_TokenizedIndex.NoIndex.No_Norms我不太了解商店选项。为什么您不想存储您的字段？标记化是拆分内容并删除干扰词/分隔符(如“和”、“或”等)我不知道规范是什么。如何存储标记化的值？如果我在“fieldName”中存储一个值“mystring”会怎样？为什么不查询fieldName:mystring返回什么？最佳答案商店.是表示该字段的值将存储在索引中商店号意味着该字段的值

linux - Lucene 上打开的文件太多错误

我正在从事的项目是对一定数量的数据(带有长文本)编制索引，并在每个时间间隔(大约15到30分钟)将它们与单词列表进行比较。一段时间后，比如第35轮，在第36轮开始索引新数据集时发生此错误:[ERROR](2011-06-0110:08:59,169)org.demo.service.LuceneService.countDocsInIndex(?:?):ExceptiononcountDocsInIndex:java.io.FileNotFoundException:/usr/share/demo/index/tag/data/_z.tvd(Toomanyopenfiles)atjav

Lucene linux java apache indexing ioexception file-not-found

php - 使用 PHP 的 Lucene

我可以将Lucene与PHP一起使用吗？我不想使用Zend。我可以在原生PHP(不是框架)中使用吗？最佳答案我建议使用ApacheSOLR作为您的Lucene后端并通过您的PHP代码中的Web服务调用进行连接。我还注意到，无需加载整个框架即可轻松挑选Zend框架的组件以在您的应用程序中使用。您可以在您的站点中使用Zend_Search_Lucene并放弃Zend的MVC、数据库和相关组件。关于php-使用PHP的Lucene，我们在StackOverflow上找到一个类似的问题：

Lucene php section Zend

mongodb - 将 mongodb 与 solr 集成的动机是什么

关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题吗？更新问题，以便editingthispost提供事实和引用来回答它.关闭6年前。ImprovethisquestionMongodb是一个nosql数据库，任何查询都可以在上面运行，除了全文搜索，因为它会降低整体性能。Solr是一个搜索引擎。当我们将这两者集成在一起时，我们在两个系统中是否拥有相同的数据？因此，如果我们已经要存储数据，为什么我们不直接将其存储在solr和lucene中。顺便说一句，我不确定solr何时仅存储索引或与数据一起存储。最佳答案

mongodb solr section stackoverflow class lucene

mongodb - 将 mongodb 与 solr 集成的动机是什么

关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题吗？更新问题，以便editingthispost提供事实和引用来回答它.关闭6年前。ImprovethisquestionMongodb是一个nosql数据库，任何查询都可以在上面运行，除了全文搜索，因为它会降低整体性能。Solr是一个搜索引擎。当我们将这两者集成在一起时，我们在两个系统中是否拥有相同的数据？因此，如果我们已经要存储数据，为什么我们不直接将其存储在solr和lucene中。顺便说一句，我不确定solr何时仅存储索引或与数据一起存储。最佳答案

mongodb solr section stackoverflow class lucene

java - 如何使用 QueryParser 执行包含特殊字符的 lucene 查询？

事情就是这样。我有一个存储在索引中的词，其中包含特殊字符，例如'-'，最简单的代码是这样的:Documentdoc=newDocument();doc.add(newTextField("message","1111-2222-3333",Field.Store.YES,Field.Index.NOT_ANALYZED));writer.addDocument(doc);然后我使用QueryParser创建一个查询，如下所示:StringqueryStr="1111-2222-3333";QueryParserparser=newQueryParser(Version.LUCENE_3

QueryParser lucene section code java

java - Lucene 初学者教程

已结束。此问题不符合StackOverflowguidelines.它目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于StackOverflow来说是无关紧要的，因为它们往往会吸引固执己见的答案和垃圾邮件。相反，describetheproblem以及到目前为止为解决这个问题所做的工作。关闭9年前。Improvethisquestion我以前从未在Java中做过任何事情，但我想使用Lucene在网站上进行搜索。我很难为一个完整的初学者找到一个好的分步教程。谁能推荐一个好的教程？谢谢最佳答案除了user428

初学 Lucene section noreferrer noopener java

MongoDB全文搜索与Lucene？

关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题吗？更新问题，以便editingthispost提供事实和引用来回答它.关闭8年前。Improvethisquestion目前MongoDB的全文搜索与Lucene相比如何？这个问题的原因是由于我不确定:a)在生产中使用mongo的FTS实现，因为大约6个月前它仍处于测试阶段和b)因为lucene使用Java，这将引入另一个移动部分。最佳答案在不纠结于可能不适合编程论坛的冗长主题的情况下，我将尝试基本涵盖这一点，但仍会尝试涵盖要点。进行广泛比较时要考虑

MongoDB 全文 section strong stackoverflow lucene

mongodb - NoSQL (MongoDB) vs Lucene (或 Solr) 作为你的数据库

关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题吗？更新问题，以便editingthispost提供事实和引用来回答它.关闭去年。Improvethisquestion随着基于文档数据库的NoSQL运动不断发展，我最近关注了MongoDB。我注意到与如何将项目视为“文档”有惊人的相似之处，就像Lucene(和Solr的用户)所做的那样。那么，问题来了:为什么要使用NoSQL(MongoDB、Cassandra、CouchDB等)而不是Lucene(或Solr)作为“数据库”？我(我相信其他人)在答案中寻找的是对它们的一些深入比较。让我们一起跳过关系数据库讨

mongodb section Lucene solr memcached nosql

ruby - 是否可以在 Solr/Lucene 中模拟余弦相似度？

我对使用Solr对余弦相似度算法建模的可能方法很感兴趣。我有分配了矢量的项目，例如:items=[{id:1,vector:[0,0,0,2,3,0,0]},{id:2,vector:[0,1,0,1,5,0,0]},{id:3,vector:[2,3,0,0,0,1,0]},{id:4,vector:[1,2,4,6,5,0,0]}]以及其他需要排名的搜索向量。目前，我通过遍历所有项目并根据输入向量为它们分配一个等级，在ruby中对此进行建模。这是我正在使用的余弦相似度的实现:moduleSimilarityCalculatordefself.get_similarity(vec

Lucene ruby vector section code solr cosine-similarity