LUCENE

php - Zend_Search_Lucene 的替代品？

关闭。这个问题是off-topic.它目前不接受答案。想改进这个问题吗？Updatethequestion所以它是on-topic用于堆栈溢出。关闭10年前。Improvethisquestion我想知道是否有任何其他库或模块可以替代Zend_Search_Lucene。

php - 如何提高 Zend Lucene 的性能？

我目前正在努力加快我的ZendLucene指数。它包含大约1M的文档。在某些情况下，搜索它最多需要0.4秒。这是NotAcceptable。我希望它最多能在0.1秒内返回结果。该文档不包含有关引擎性能问题的任何信息，只是说该引擎具有良好的可扩展性。我唯一学到的是使用optimize()方法的可能性。但这还不够。因此，我有两个问题:添加到每一行(文档)的字段顺序是否重要(就性能而言)？我可以使用任何其他参数来加快速度吗？也许它可能是一些用于索引的参数或一些服务器设置(更多内存等) 最佳答案我建议转向真正的Lucene(或Solr)以

Lucene Zend section 数来 php zend-framework full-text-search zend-search-lucene

java - 在 solr 5.1.0 中找不到用于配置的正确 solrconfig.xml 文件

我之前设置了Solr4.7，并且在我的核心中为数据导入requestHandler配置了solrconfig.xml文件，它工作正常。但是当我设置Solr5.1.0时，特定核心的solrconfig.xml文件的位置是什么？它位于何处？最佳答案当您第一次使用bin/solr-e云尝试SolrCloud时，相关的配置集会自动上传到zookeeper并与新创建的集合链接。以下命令将使用默认集合名称(gettingstarted)和上传并链接到它的默认配置集(data_driven_schema_configs)启动SolrCloud

solrconfig java section strong data_driven_schema_configs php solr lucene solrcloud

php - Zend_Search_Lucene 范围查询错误

我已经为每个文档设置了一个日期字段。(关键字)其中存储的值采用这种格式；20100511每次尝试执行范围查询时，我都会收到以下错误:date:[10000000TO20000000]Atleastonerangequeryboundarytermmustbenon-emptyterm有人知道吗？更新我已经让它以编程方式工作。这是否意味着解析器有问题？$from=newZend_Search_Lucene_Index_Term('10000000','dateOfBirthMod');$to=newZend_Search_Lucene_Index_Term('20000000','dat

Zend_Search_Lucene Search section Lucene php zend-framework zend-search-lucene

PHP 查找相关性

假设我收集了100,000篇文章，涉及10个不同的主题。我不知道哪些文章实际上属于哪个主题，但我有整篇新闻文章(可以分析它们的关键字)。我想根据主题对这些文章进行分组。知道我该怎么做吗？任何引擎(sphinx、lucene)都可以。最佳答案在机器学习/数据挖掘方面，我们称这类问题为分类问题。最简单的方法是使用过去的数据来预测future，即面向统计:http://en.wikipedia.org/wiki/Statistical_classification，您可以在其中开始使用朴素贝叶斯分类器(常用于垃圾邮件检测)我建议您阅读

PHP 查找 section strong noreferrer lucene sphinx

【Elasticsearch-1】ES原理及安装es8.2.0

目录ES是什么？Lucene是什么？ES基本组件ES架构（集群组件）ES工作原理ES默认端口ES应用场景集群构建 1、安装jdk配置jdk 2、安装ES3、修改yml配置文件4、验证es是否启动成功产生背景：海量数据查询需要毫秒级或者秒级返回结果购物商城输入手机，页面需要快速返回数据ES是什么？是一个基于lucene实现的开源、分布式、RESTful的全文本搜索引擎，此外，他还是一个分布式实时文档存储，其中每个文档的每个域都是被索引的数据，且可以被搜索，也是一个带实时分析功能的分布式搜索引擎，可以扩展至数以百计的节点实时处理PB级别的数据Lucene是什么？专

Elasticsearch 2.0 margin-left margin style lucene 搜索引擎

ElasticSearch分片与Lucene Index

在ES中一个索引有一个或者多个分片构成，在创建索引的时候可以设置主分片和副本分片的数量，当主分片确定之后就不可以再修改了(因为路由需要基于这个数量来分发请求)，而副本分片数量随时可以修改PUT/myIndex{"settings":{"number_of_shards":2,//该索引有2个分片"number_of_replicas":1//每个分片都有一个副本}} 这里我假设说是建立了两个节点，就是起了两个ES服务，shard1跟shard2就是创建的两个主分片，replica1和replica2就是两个副本分片，一般为了实现高可用，ES会将主分片和副本分片保存

ElasticSearch Lucene xff0c xff0 xff 搜索引擎

php - Zend Search Lucene 数值范围搜索

我很难确定我对ZendSearchLucene如何在范围内索引和搜索整数的误解。在下面的示例中，我希望输出为1，但它始终为2(两个结果)。任何提示将不胜感激。addField(Zend_Search_Lucene_Field::Text('foo','Hello'));$doc->addField(Zend_Search_Lucene_Field::Keyword('bar',100));$search->addDocument($doc);$doc=newZend_Search_Lucene_Document();$doc->addField(Zend_Search_Lucene_F

Search Lucene Zend_Search_Lucene_Field php zend-framework

php - 注意: undefined offset :在第641行的/my/Zend/ib/Search/Lucene/Index/SegmentInfo.php中

我在使用zendsearch-lucene框架编制索引时遇到问题。我们的文件存储库有大约25000个文件，我正试图为它们建立索引。但在批索引过程中，出现了以下错误：Notice:Undefinedoffset:2047in/my/Zend/lib/Search/Lucene/Index/SegmentInfo.phponline641Notice:Tryingtogetpropertyofnon-objectin/my/Zend/lib/Search/Lucene/Index/SegmentMerger.phponline202Fatalerror:Uncaughtexception'

SegmentInfo php Search Lucene zend-framework batch-processing zend-search-lucene

php - Lucene 外来字符问题

我在使用Zend_Lucene和像åäö这样的外来字符时遇到了一些严重的问题。这些问题在创建索引和查询索引时都会出现。我已经尝试了iso-8859-1和utf-8。ISO-8859-1无效的查询看起来像“+_area:skåne”。使用Zend_Lucene我没有得到任何匹配项，但是如果我在Luke中运行这个查询，我会得到很多匹配的文档。索引包含20个字段。“_area”字段使用以下语法添加:$doc->addField(Zend_Search_Lucene_Field::keyword('_area',strtolower($item['area']),'iso-8859-1'));

外来 Lucene Search Zend php zend-framework

1 2 345 6 7