草庐IT

ext_conf_template

全部标签

org.apache.hadoop.conf.Configuration.getLocalpath(配置)中的 java.lang.NullPointerException

有没有人遇到过这个问题?ThefollowingaretheerrorinformationwhenIrunthejob:13/01/1015:53:19INFOmapred.JobClient:TaskId:attempt_201301101540_0001_m_000010_0,Status:FAILEDjava.lang.NullPointerExceptionatorg.apache.hadoop.conf.Configuration.getLocalPath(Configuration.java:934)atnfs.iscas.sil.hcir.index.ImageInde

hadoop - 运行 Hadoop 示例时出现错误 : package org. apache.hadoop.conf 不存在

我已经使用exportCLASSPATH=${CLASSPATH}:/~Downloads/hadoop-1.0.4/*.jar将hadoopjars添加到类路径中,但我仍然我收到找不到包的错误。我正在使用Java1.7.0_17。有人知道如何正确设置hadoopjar的类路径吗? 最佳答案 您要将它们设置到的不是CLASSPATH,而是HADOOP_CLASSPATH。我喜欢使用以下命令添加当前目录和lib目录中的所有jar依赖项:exportHADOOP_CLASSPATH=$HADOOP_CLASSPATH:`echo*.ja

hadoop - Nutch 2.0 和 Hadoop。如何防止缓存 conf/regex-urlfilter.txt

我在一台机器上安装了nutch2.x和hadoop1.2.1。我配置seed.txt、conf/regex-urlfilter.txt并运行命令crawlurls/seed.txtTestCrawlhttp://localhost:8088/solr/2然后我想更改conf/regex-urlfilter.txt中的规则我在2个文件中更改了它:~$find.-name'regex-urlfilter.txt'./webcrawer/apache-nutch-2.2.1/conf/regex-urlfilter.txt./webcrawer/apache-nutch-2.2.1/runt

java - Hadoop conf 文件丢失

我正在通过IbmBigInsights提供的RHEL5上的虚拟机镜像使用hadoop,我无法找到conf文件夹。我想用eclipse嵌入jaql来开发一个前端。 最佳答案 在IBMBiginsightshadoop发行版中,hadoop库、conf、脚本等默认位于/opt/ibm/biginsights/目录下。您可以使用以下查找命令定位到各个组件的配置目录find/opt/ibm-iname"*-site.xml" 关于java-Hadoopconf文件丢失,我们在StackOverf

hadoop - 每小时将推文保存到单个 Flume 数据文件的 flume.conf 参数应该是多少?

我们将推文保存在目录顺序中,例如/user/flume/2016/06/28/13/FlumeData...。但每小时它会创建超过100个FlumeData文件。我更改了TwitterAgent.sinks.HDFS.hdfs.rollSize=52428800(50mb)同样的事情又发生了。之后我也尝试更改rollcount参数但没有成功。我如何设置参数以每小时获取一个FlumeData文件。 最佳答案 rollInterval怎么样?你把它设置为零了吗?如果是,那么问题可能出在其他地方。如果rollInterval设置为某个值,

linux - Hadoop HDFS 测试运行问题 - org.apache.hadoop.conf.Configuration NoClassDefFoundError

我正在使用Hadoop0.21.0。并尝试运行CAPI库附带的hdfs_test应用程序。经过许多问题后,我能够编译hdfs_test。现在,当我运行它时:./hdfs_test我收到以下错误:Exceptioninthread"main"java.lang.NoClassDefFoundError:org/apache/commons/logging/LogFactoryatorg.apache.hadoop.conf.Configuration.(Configuration.java:153)Causedby:java.lang.ClassNotFoundException:org

hadoop - 修改hadoop conf目录下的xml配置文件后需要重启hadoop吗?

假设我通过hadoop中的conf文件更改了tasktracker的端口号或更改了最大map任务的数量,我是否需要停止并重新启动服务器/守护进程? 最佳答案 这取决于您更改的选项,但对于您提供的两个示例,我会说是,重新启动mapred服务(您不需要为这些选项重新启动DFS服务)。我认为在修改特定选项时需要重新启动的任何地方都没有详尽的列表。 关于hadoop-修改hadoopconf目录下的xml配置文件后需要重启hadoop吗?,我们在StackOverflow上找到一个类似的问题:

Hadoop conf确定num map任务

我有一份工作,就像我所有的Hadoop工作一样,从我在Hadoop界面中看到的运行时,它似乎总共有2个maptask。但是,这意味着它加载了太多数据,以至于我收到Java堆空间错误。我已经尝试在我的Hadoop集群中设置许多不同的conf属性来将作业拆分为更多任务,但似乎没有任何效果。我试过设置mapreduce.input.fileinputformat.split.maxsize、mapred.max.split.size、dfs.block.size但似乎没有任何效果。我正在使用0.20.2-cdh3u6,并尝试使用cascading.jdbc运行作业-该作业无法从数据库读取数据

hadoop - 了解作业 conf.xml 参数 pig.script.features

参数是什么pig.script.features66080在jobs_*_conf.xml中表示?它对调整hadoop集群/pig工作流有用吗?网上是否有此类参数的列表及其值的解释? 最佳答案 此参数来自PIG-1333它实际上只不过是脚本级功能的紧凑表示。您看到一个整数值,但它实际上是一个位设置,用于确定在整个Pig脚本中使用哪些功能(不仅仅是在作业级别)关于功能本身,您可以查看以下枚举:staticenumPIG_FEATURE{UNKNOWN,MERGE_JION,REPLICATED_JOIN,SKEWED_JOIN,HAS

hadoop - 如何在 hive udf 中传递 Hive conf 变量?

我想将hiveconf变量传递给hiveUDF。下面是一段代码。hive-f../hive/testHive.sql-hivevartestArg=${testArg}下面是HiveUDF调用。selectsetUserDefinedValueForColumn(columnName,'${testArg}')fromtestTable;在udf中,我将testArg的值设为null。请告诉我如何在udf中使用hiveconf变量以及如何在hiveUDF中访问Hive配置? 最佳答案 我认为您应该使用以下命令将配置单元变量作为“hi