compass-lucene

java - Zend Lucene 是否需要 Java Lucene？

在实现ZendLucene时，我们的服务器是否需要安装Java？最佳答案虽然我没用过，看来你不需要Java来使用Zend_Search_Lucenecomponent.根据文档，Zend_Search_Lucene是Lucene的完全PHP实现。但是，支持interoperabilitybetweentheJavaindexesandthePHPindexes. 关于java-ZendLucene是否需要JavaLucene？，我们在StackOverflow上找到一个类似的问题：

java - 一起使用 Solr 和 Zends Lucene 端口

下午的伙计们，在我使用Zend-Lucene-Search冒险之后，发现它在索引大型数据集时并没有像人们想象的那样，我转向了Solr(为此感谢BillKarwin:))我现在让Solr更快地为数据库建立索引，只需8分钟多一点就可以为一个超过170万行的表建立索引——我对此感到非常满意。但是，当我尝试使用Zend端口搜索索引时，我遇到了以下错误；fatalerror:在/var/www/Zend/Search/Lucene.php:407堆栈跟踪中出现未捕获的异常“Zend_Search_Lucene_Exception”和消息“Unsupportedsegmentsfileformat

Lucene Zends section Zend java php solr zend-search-lucene

php - 使用 Zend_Search_Lucene 搜索数字

那么为什么下面的第一个搜索示例没有返回任何结果？非常感谢任何有关如何修改以下代码以使数字搜索成为可能的想法。创建索引$index=newZend_Search_Lucene('/myindex',true);$doc->addField(Zend_Search_Lucene_Field::Text('ssn','123-12-1234'));$doc->addField(Zend_Search_Lucene_Field::Text('cats','Fluffy'));$index->addDocument($doc);$index->commit();搜索-无结果$index=newZ

Zend_Search_Lucene Search Lucene section php zend-framework full-text-search

java - 使用 Lucene 进行分词和索引，如何处理外部分词和词性？

我想构建我自己的——我不确定是哪一个——分词器(从Lucene的角度来看)或我自己的分析器。我已经写了一个代码，用word标记我的文档(作为List或ListWord>其中Word是一个只有一种容器的类3publicString:word,pos,lemma-pos代表词性标签)。我不确定要索引什么，也许只有“Word.lemma”或类似“Word.lemma+'#'+Word.pos”，可能我会根据词性从停用词列表中进行一些过滤。顺便说一句，这是我的误解:我不确定我应该在哪里插入LuceneAPI，我应该将自己的分词器包装在新的分词器中吗？我应该重写TokenStream吗？我应该认

何处 Lucene String strong pathToExternalBinary java nlp tokenize

java - Lucene - 相当于 SQL "IN"关键字

请原谅我的新手问题。我曾尝试搜索答案，但考虑到关键字，搜索此类内容非常困难...我正在使用Lucene5.2.x来索引一组文档，每个文档都有两个字段:id和description。我从系统中的先前查询中获得了一组ids。现在，我想获取有关description的Lucene文本搜索结果，但只能来自ids集合中的文档。如果我在MySQL中(天真地)这样做，我可能会做类似的事情:SELECT*FROMmytableWHEREdescriptionLIKE'blah%'ANDidIN(6345,5759,333,...)ids的集合可能有数万个。使用Lucene的最佳方法是什么？我可以构造一

amp 相当 code Lucene BooleanQuery java

java - Lucene 空间、准确性

我正在遵循“LuceneinAction”中的示例，第308-315页，它描述了LuceneSpatial。我正在使用lucene2.9.4。我用过http://geocoder.us/service/distanceendpoint来计算一些位置之间的距离，然后编写单元测试来验证索引可以找到给定半径内的位置。我想知道我能期望lucene有多准确。例如，如果我给半径10.0，我的纬度/经度点之间的距离是9.99英里，它是否能够在所有情况下找到这个位置？提出这个问题的是，我发现搜索对于小半径值(例如10.0或更小)非常准确，而对于较大的值(例如r=25.0)则不准确。有什么我可能做错的吗

Lucene java spatial apache

java - 如何使用 Lucene 生成唯一 ID？

我正在使用Lucene来存储(以及索引)各种文档。每个文档都需要一个持久的唯一标识符(用作URL的一部分)。如果我使用的是SQL数据库，我可以使用integerprimarykeyauto_increment(或类似的)字段为添加的每条记录自动生成唯一ID。有没有办法用Lucene做到这一点？我知道Lucene中的文档是有编号的，但我注意到这些编号会随着时间的推移而重新分配。(我使用的是Java版本的Lucene3.0.3。) 最佳答案正如larsmans所说，您需要将其存储在单独的字段中。我建议您对字段进行索引和存储，并使用Ke

Lucene java section 的

java - Lucene:termFreqVector 总是空的？

对于任何文档，termFreqVector始终为空。我确定文档在集合中并且该字段存在。那么问题出在哪里呢？for(inti=0;iTermFreqVectortfv=reader.getTermFreqVector(i,"标签");谢谢最佳答案您确定要使用Field.TermVector.YES对您的字段进行索引吗？这是一个工作示例:Directorydirectory=newRAMDirectory();Analyzeranalyzer=newStandardAnalyzer(Version.LUCENE_30);MaxFie

termFreqVector Lucene section reader Field java

java - Lucene - 从术语中获取文档 ID

在Lucene4.1中，我看到您可以使用DirectoryReader.docFreq()来获取包含给定术语的索引中的文档数。有没有办法真正获得这些文件？对象或ID号都可以。我认为AtomicReader.termDocsEnum()会很有用，但我不确定我是否可以使用AtomicReader-我不知道如何在给定目录上创建AtomicReader实例。最佳答案为什么不直接搜索呢？IndexSearchersearcher=newIndexSearcher(directoryReader);TermQueryquery=newTer

Lucene java section AtomicReader 给定

java - COMPASs Monitor 不显示任何应用程序

我正在使用COMPS运行COMPSsSampleApplicationManual中所示的增量应用程序.我添加了-m标志以启用监控功能:$runcompss-m--debugincrement.Increment5123应用程序正常运行并完成(std输出/错误中没有显示错误，并且.COMPSs文件夹中的runtime.log没有任何堆栈跟踪)。我还启动了运行以下命令的COMPSsMonitor服务(我还添加了它的输出)$/etc/init.d/compss-monitorstart*StartingCOMPSsMonitor*CheckingJAVAInstallation...Suc

COMPASs Monitor COMPSs code java distributed-computing hpc

3 4 567 8 9