草庐IT

solrcloud

全部标签

java - 在 solr 5.1.0 中找不到用于配置的正确 solrconfig.xml 文件

我之前设置了Solr4.7,并且在我的核心中为数据导入requestHandler配置了solrconfig.xml文件,它工作正常。但是当我设置Solr5.1.0时,特定核心的solrconfig.xml文件的位置是什么?它位于何处? 最佳答案 当您第一次使用bin/solr-e云尝试SolrCloud时,相关的配置集会自动上传到zookeeper并与新创建的集合链接。以下命令将使用默认集合名称(gettingstarted)和上传并链接到它的默认配置集(data_driven_schema_configs)启动SolrCloud

java - Solr Custom Similarity - 使用索引文档中的字段

我们目前使用的是非常旧的LuceneV4.X版本,现在正在迁移到SolrV7.4.0云。我们有一个自定义的相似度类,我们用它来影响我们在文档中使用的索引字段(“RANK”)的分数。这是类的样子-CustomSimilarity.javapublicclassCustomSimilarityextendsSimilarity{privatefinalSimilaritysim;privatefinaldoublecoefficiency;privateStringpopularityRank;staticInfoStreaminfoStream;publicCustomSimilarit

hadoop - 如何使用 Solr 索引目录中的所有 csv 文件?

给定一个包含数百个制表符分隔的csv文件的目录,每个文件的第一行都没有标题。这意味着我们将通过其他方式指定列名。这些文件可以位于本地磁盘或HDFS上。索引这些文件的最有效方法是什么? 最佳答案 如果你有很多文件,我认为有几种方法可以提高索引速度:首先,如果你的数据在本地磁盘上,你可以使用多线程建立索引,但需要注意,每个线程都有自己的索引输出目录。最后将它们合并成一个索引,以提高搜索速度。其次,如果你的数据在HDFS上,我觉得使用HadoopMapReduce来建立索引是非常强大的。另外,Pig或者Hive的一些UDF插件也可以很方便

hadoop - CDH 5.7 上的 Streamsets solrcloud 无法连接到 Solr

我在CDH5.7.0版上使用流集从HDFS(源)加载文件并在Solr(目标)上创建记录的示例工作流程。验证失败-SOLR_03-无法连接到Solr实例:org.apache.solr.common.cloud.ZooKeeperException::ZooKeeper连接字符串。但是,从日志中,我看到它能够连接到zookeeper,但是,在调用/live_nodeszookeeperapi后以某种方式关闭了session。2016-06-0316:30:21,336INFOorg.apache.solr.common.cloud.ConnectionManager:Clientisco