apache-karaf_草庐IT

hadoop - 如何为 Apache Hadoop NameNode 启用 GC 日志记录，同时防止日志文件覆盖和限制磁盘空间使用

我们最近决定在多个集群(具体版本各不相同)上为HadoopNameNode启用GC日志记录，以帮助调查与NameNode相关的内存和垃圾收集问题。我们希望集群中的所有NameNode(事件和备用或主要和次要)都这样做。我们还想避免两个我们知道可能会发生的问题:当NameNode因任何原因重启时覆盖日志文件日志使用过多的磁盘空间，导致磁盘被填满当为进程启动JavaGC日志记录时，它似乎会替换任何具有相同名称的文件的内容。这意味着除非您小心，否则您将丢失GC日志记录，也许在您更有可能需要它的时候。如果您让集群运行足够长的时间，日志文件将填满磁盘，除非进行管理。即使GC日志记录目前不是很多，

何为 NameNode code hadoop logging garbage-collection diskspace

hadoop - 如何启动 Apache Kylin？

我正在尝试安装apachekylin1.5.4.1，我正在关注这个URL:http://kylin.apache.org/docs15/install/index.html在启动服务器时，我遇到了这样的问题，$kylin.shstartKYLIN_HOMEissetto/usr/local/kylincat:/usr/local/kyli:Nosuchfileordirectorycat:/conf/kylin.properties:Nosuchfileordirectory-mkdir:Notenougharguments:expected1butgot0Usage:hadoopfs

hadoop Apache section HOME kylin

apache - 名称节点未启动

我正在尝试设置一个hadoop集群。但是名称节点没有启动。当我检查日志时，它显示:2016-10-1905:23:10,140FATALorg.apache.hadoop.hdfs.server.namenode.NameNode:Failedtostartnamenode.java.lang.IllegalArgumentException:Illegalcharacterinschemenameatindex0:192.168.100.101:9001atjava.net.URI.create(URI.java:859)atorg.apache.hadoop.hdfs.server

apache 名称 java NameNode hadoop hdfs

hadoop - Apache Spark 无法在 Windows 上运行

我已经下载并安装了spark-2.0.1-bin-hadoop2.7。我安装了JAVA并在系统变量中设置了JAVA_HOME。但是在运行中我有这个错误:如何修复？最佳答案我认为问题在于路径中的空格。尝试将下载的spark放入例如。F:\Msc\BigData\BigDataSeminar\Spark\还要检查SPARK_HOME、JAVA_HOME和HADOOP_HOME是否放置在没有空格的路径中。关于hadoop-ApacheSpark无法在Windows上运行，我们在Stack

Windows hadoop section strong code apache-spark installation

hadoop - 在 Spark 集群和 YARN 上运行的 Apache Zeppelin

我在ApacheZeppelin中创建并运行了一个%pyspark程序，该程序在带有yarn-client的Spark集群上运行。该程序正在从HDFS读取Dataframe中的文件，并执行一个简单的groupby命令并成功打印输出。我使用的是Zeppellin版本0.6.2和Spark2.0.0。我可以看到作业在YARN中运行(参见application_1480590511892_0007):但是当我同时检查SparkUI时，这个工作什么也没有:问题1:这份工作不应该出现在这两个窗口中吗？此外，上面SparkUI图像中已完成的应用程序是带有%python解释器的Zeppelin作业，

Zeppelin hadoop strong section 中运 apache-spark pyspark apache-zeppelin

Spring 安全性与 Apache Shiro

这个问题在这里已经有了答案:Shirovs.SpringSecurity[closed](3个回答)关闭4年前。到目前为止，我所研究的大多数人都说ApacheShiro易于使用并且易于与CAS集成(用于SSO等)。只是想问是否有人有使用这两种方法的经验以及使用哪一种以及为什么一种比另一种更好？最佳答案许多Shiro开发人员在他们的应用程序中使用Spring，因此Shiro在Spring环境中运行良好。到目前为止，我们收到的一般反馈是Shiro也比SpringSecurity更容易理解(对于大多数人来说)。但是，如果您想要跨任何W

Spring Apache section Shiro security spring-security

Spring 安全性与 Apache Shiro

这个问题在这里已经有了答案:Shirovs.SpringSecurity[closed](3个回答)关闭4年前。到目前为止，我所研究的大多数人都说ApacheShiro易于使用并且易于与CAS集成(用于SSO等)。只是想问是否有人有使用这两种方法的经验以及使用哪一种以及为什么一种比另一种更好？最佳答案许多Shiro开发人员在他们的应用程序中使用Spring，因此Shiro在Spring环境中运行良好。到目前为止，我们收到的一般反馈是Shiro也比SpringSecurity更容易理解(对于大多数人来说)。但是，如果您想要跨任何W

Spring Apache section Shiro security spring-security

hadoop - 如何在 Apache NiFi 中动态地将值从 executeSQL 传递到 SelectHiveQL

我有两个表，一个在mysqltest.employee中，另一个在hivedefault.dept中我想通过test.employee表的empid作为参数在hive表中查询并将数据存储到HDFSExecuteSQL->selectempidfromtest.employee(给出10条记录)SelectHiveQL->SELECT*FROMdefault.deptwhereempid=${empid}(应检索10条记录)imagedescriptionhere 最佳答案您可以执行以下操作:ExecuteSQL-检索员工记录Con

何在 SelectHiveQL section empid hadoop hive minify apache-nifi hdf

hadoop - Apache Solr 支持 ORC 文件格式

我在Hive中有一堆表，存储为ORC。我想在SolrCloud集合中索引他们的数据。Solr是否支持索引以ORC格式存储的数据？我用谷歌搜索，但没有找到任何结果。最佳答案看起来您希望SolR从特定的Hive文件格式读取数据。您可能会以另一种方式看待问题，即使用Hive将数据写入SolR——从而让Hive处理实际输入文件的复杂性格式(无论是ORC、Parquet、AVRO还是其他格式——甚至是HBase数据文件)。在LucidWorksGitHubrepo您会发现一个标记为hive-solr的项目。看看。

hadoop Apache section strong Hive solr orc

hadoop - Apache Zeppelin (Shiro Security) 无法保存笔记权限

我是Zeppelin的新手。我遵循了有关如何在Zeppelin中设置身份验证的教程并创建了两个帐户。这是我的shiro.ini配置文件:[users]#ListofuserswiththeirpasswordallowedtoaccessZeppelin.#Touseadifferentstrategy(LDAP/Database/...)checktheshirodocathttp://shiro.apache.org/configuration.html#Configuratio$admin=adminjoao=joao#user2=password3,role3#user3=pa

Zeppelin Security activeDirectoryRealm section sessionManager hadoop shiro apache-zeppelin