compass-lucene

java - 在 lucene 4.7.0 中找不到 standard.StandardAnalyzer

我是lucene的新手。我正在尝试在这里做教程http://www.lucenetutorial.com/lucene-in-5-minutes.html网站正在导入:importorg.apache.lucene.analysis.standard.StandardAnalyzer;但是，在我的intellij上，我无法在分析包中找到任何标准。所以，我真的不能使用StandardAnalyzer。我需要使用不同的jar吗？我使用的jar是lucene-core-4.7.0.jar我从中导入lucene-4.7.0/core目录。我在这里错过了什么？最佳答

java - 使用 Lucene 增强新文档

Lucene是否提供了增加新文档的方法？例如，假设Lucene文档包含一个日期字段。是否有可能在不让用户改变查询的情况下，以更高的分数呈现最新的文档？我不想诉诸粗略的“按日期排序”解决方案，因为它会完全取消评分算法。最佳答案您可以看到LuceneinAction。在第二版中，pg。187他们给出了一种方法来做到这一点。基本上，您需要编写自己的查询来扩展CustomScoreQuery，并增加一个提升。关于java-使用Lucene增强新文档，我们在StackOverflow上找到一

Lucene java section stackoverflow information-retrieval

java - 如何让 Lucene 中的 QueryParser 处理数字范围？

newQueryParser(....).parse(somequery);它仅适用于字符串索引字段。假设我有一个名为count的字段，其中count是一个整数字段(在索引字段时我考虑了数据类型)newQueryParser(....).parse("count:[1TO10]");上面那个不行。相反，如果我使用正在工作的"NumericRangeQuery.newIntRange"。但是，我只需要上面的... 最佳答案遇到同样的问题并解决了，所以在这里分享我的解决方案:要创建一个自定义查询解析器，它将解析以下查询“INTFIEL

QueryParser Lucene code section TermQuery java

java - Lucene - 精确的字符串匹配

我正在尝试创建一个Lucene4.10索引。我只想在索引中保存我放入文档中的确切字符串，无需标记化。我正在使用StandardAnalyzer。Directorydir=FSDirectory.open(newFile("myDire"));Analyzeranalyzer=newStandardAnalyzer();IndexWriterConfigiwc=newIndexWriterConfig(Version.LUCENE_4_10_0,analyzer);iwc.setOpenMode(OpenMode.CREATE);IndexWriterwriter=newIndexWri

Lucene java code 34 StringField tokenize

java - 在 Lucene 中获取术语频率

有没有一种快速简便的方法可以从Lucene索引中获取术语频率，而无需通过TermVectorFrequencies类来完成，因为这对于大型集合来说会花费大量时间？我的意思是，有没有像TermEnum这样的东西，它不仅有文档频率，还有词频？更新:使用TermDocs太慢了。最佳答案使用TermDocs获取给定文档的词频。与文档频率一样，您可以使用感兴趣的术语从IndexReader中获取术语文档。在不失一般性的情况下，您找不到比TermDocs更快的方法。TermDocs直接从索引段中的“.frq”文件读取，其中每个词频按文档顺序

Lucene java code section TermDocs full-text-search

java - 与 lucene 索引一起使用的最佳跨语言分析器

按照目前的情况，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visitthehelpcenter指导。关闭10年前。我正在寻找有关将哪种分析器用于具有多种语言文档的索引的反馈。目前我正在使用simpleanalyzer，因为它似乎可以处理最广泛的语言。大多数被索引的文件都是英文的，但偶尔也会有双字节语言被索引。是否还有其他建议，或者我应该坚持使用simpleanalyzer。谢谢

分析器 lucene section notice simpleanalyzer java

java - Lucene 似乎在缓存搜索结果——为什么？

在我的项目中，我们使用Lucene2.4.1进行全文搜索。这是一个J2EE项目，IndexSearcher创建一次。在后台，索引每两分钟刷新一次(当内容改变时)。用户可以通过页面上的搜索机制搜索索引。问题是，Lucene返回的结果似乎以某种方式被缓存了。这是我注意到的场景:我启动应用程序并搜索“关键字”-返回了6个结果，索引已刷新，使用Luke我看到，现在有8个结果可以查询“关键字”，我再次使用该应用程序进行搜索，再次返回6个结果。我分析了我们的配置，并没有在任何地方发现任何缓存。我调试了搜索，输出代码中没有缓存，searcher.search返回6个结果。Lucene是否以某种方式在

mdash Lucene section noreferrer noopener java

java - 如何在lucene中索引日期字段

我是lucene的新手。我必须索引日期字段。我在lucene3.0.0中使用以下IndexWriter构造函数。IndexWriterwriter=newIndexWriter(FSDirectory.open(indexDir),newWhitespaceAnalyzer(),true,IndexWriter.MaxFieldLength.UNLIMITED)我的观点是:为什么在不分析日期字段时需要分析器，而索引时我使用了Field.Index.NOT_ANALYZED。最佳答案您可以用这种方式存储日期字段..Document

何在 lucene code section java date

java - Mac 用户 - 如何在 Mac 中设置 CLASSPATHS(我正在处理 Lucene 演示)

我正在尝试让我的ApacheLucene演示正常工作，我打算在本教程中设置类路径http://lucene.apache.org/java/2_3_2/demo.html我搜索了网络，这些是我找到的设置CLASSPATH的2个解决方案:CLASSPATH=${CLASSPATH}:/Users/philhunter/Desktop/COM562\Project/lucene-3.0.3/lucene-core-3.0.3.jar和setenvCLASSPATH${CLASSPATH}:/Users/philhunter/Desktop/COM562\Project/lucene-3.0

中设何在 lucene CLASSPATH section java macos

java - 使用 Lucene 的缺点是什么？

我正在考虑在我的项目中使用Lucene来进行非常快速的搜索。我知道Lucene在保存所有数据/索引的地方创建了自己的文件。我想知道使用Lucene的缺点是什么？有吗？您是否必须对文件数据库做任何事情，或者它是否在没有任何外部帮助的情况下工作得很好？附言我知道还有Lucene.NET，我敢打赌同样的规则也适用于那里。最佳答案 Lucene很棒。非常灵活，速度惊人，而且是可靠的API。邮件列表非常有用。文件确实需要一些维护，但可以使用提供的工具来完成。最重要的是偶尔优化索引，但这只有在您定期更新索引时才需要。我建议您也研究一下Solr

缺点 Lucene section 的 java .net full-text-search lucene.net

4 5 678 9 10