草庐IT

ext_conf_template

全部标签

java - org.apache.hadoop.conf.Configuration loadResource错误

我正在创建一个简单的helloworldhadoop项目。我真的不知道要包括什么来解决这个错误。似乎hadoop库需要一些我没有包括的资源。我已经尝试将以下参数添加到运行配置中。但它无助于解决问题。-Djavax.xml.parsers.DocumentBuilderFactory=com.sun.org.apache.xerces.internal.jaxp.DocumentBuilderFactoryImpl这是我的代码:/***WritesastaticstringtoafileusingtheHadoopLibraries*/publicclassWriteToFile{pub

Hadoop hdfs 与 ext3

我在网上读到ext3文件系统适合运行hadoop。(http://wiki.apache.org/hadoop/DiskSetup见页尾)那为什么我们需要hdfs我假设hdfs是一个文件系统,ext3是另一种类型的文件系统请告诉我ext3和hdfs在hadoop中是如何工作的?谢谢。 最佳答案 HDFS是分布式文件系统,这意味着文件被分成更小的部分,这些部分存储在不同的节点/服务器上。特定节点/服务器可以使用ext3文件系统,这意味着HDFS文件部分以ext3物理存储在磁盘上。 关于Ha

hadoop - oozie - sqoop $SQOOP_CONF_DIR 尚未在环境中设置

我正在尝试使用oozie(霍顿作品)运行sqoop。这是我第一次尝试运行oozie工作流,但出现以下错误InvokingSqoopcommandlinenow1811[main]WARNorg.apache.sqoop.tool.SqoopTool-$SQOOP_CONF_DIRhasnotbeensetintheenvironment.Cannotcheckforadditionalconfiguration.2015-12-2116:58:45,913WARN[main]tool.SqoopTool(SqoopTool.java:loadPluginsFromConfDir(177

hadoop - Hive:SHOW CONF 不遵守 hive-site.xml

我有以下配置单元站点配置:[hadoop@ip-10-102-201-205~]$cat/etc/hive/conf.dist/hive-site.xmlhbase.zookeeper.quorumip-10-102-201-205.ec2.internalhttp://wiki.apache.org/hadoop/Hive/HBaseIntegrationhive.execution.enginemrfs.defaultFShdfs://ip-10-102-201-205.ec2.internal:8020hive.metastore.uristhrift://ip-10-102-2

java - Spring Hadoop 配置 - 没有符合条件的 org.apache.hadoop.conf.Configuration 类型的 bean

我正在尝试为Hadoop/Hive环境配置bean。根据文档,我需要ApacheHadoop配置类,它应该是Autowiring的。请参阅:http://docs.spring.io/spring-hadoop/docs/2.4.0.RELEASE/reference/html/springandhadoop-store.html(6.2.2节配置数据集支持)然而,当我尝试运行我的应用程序时,我得到:NoSuchBeanDefinitionException:没有找到类型为[org.apache.hadoop.conf.Configuration]的符合条件的bean依赖:预计至少有1

amazon-web-services - 在EMR集群上如何进入/etc/hadoop/conf这个路径?

我是EMR和Spark的新手。我正在执行此处提到的这些步骤https://aws.amazon.com/premiumsupport/knowledge-center/emr-submit-spark-job-remote-cluster/.在第5步中,它说复制远程AmazonEMR集群上/etc/hadoop/conf中的所有文件。。想知道如何从/etc/hadoop/conf获取这些文件。如果我的理解有误,请指正。在此先感谢并感谢。 最佳答案 通过ssh访问EMR实例,进入文件夹/etc/hadoop/conf并将所有文件复制到

apache-spark - 如何将 hadoop conf 目录指定为 conf 属性以启动应用程序

是否有一个spark属性,我们可以在执行spark提交时设置它指定hadoop配置路径,专门指向自定义hdfs-site.xml和core-site.xml文件 最佳答案 首选的方法是在spark-submit之前设置Hadoop配置目录,而不是单独配置这些文件。exportHADOOP_CONF_DIR=/your/hadoop/dir但如果必须使用sparkConfig来设置,可以按如下方式设置,sparkConfig.set("spark.hadoop.yarn.resourcemanager.hostname","XXX")

java - 从hadoop中的作业conf获取输入路径

我正在设置一个路径作为conf的输入位置FileInputFormat.setInputPaths(conf,newPath("path/to/folder"));当我尝试实现自己的RecordReader时,如何从conf中取回这个位置提前致谢... 最佳答案 此调用设置的属性是map.input.dir,因此这应该适合您:conf.get("map.input.dir");附带说明一下,您的记录阅读器应该根据initialize(InputSplit,TaskAttemptContext)方法中给出的输入拆分进行操作,因为您在s

hadoop - 如何更改 hadoop conf 目录位置?

在异常堆栈跟踪中,我可以看到我的hadoop配置是从/etc/hadoop/conf.empty/hdfs-site.xml加载的如何将其更改为/etc/hadoop/conf/hdfs-site.xml? 最佳答案 原则上,您可以在加载hadoop守护程序之前加载任何bash脚本,例如在/etc/init.d/hadoop-hdfs-datanode中用于数据节点。你可以在这个init脚本的顶部添加,exportHADOOP_CONF_DIR=/etc/hadoop/conf此外,您可以在/usr/lib/hadoop/etc/h

configuration - 在单节点集群上确定 Hadoop Conf 设置的一般方法

我想知道如何最好地确定适当数量的map和reduce任务以及JVM堆的相应最大大小?对于那些刚接触Hadoop的人来说,这些是在mapred-site.xml文件。有没有我可以根据(虚拟)内核和RAM的数量遵循的通用公式?在您的回复中,请考虑在作业之前/期间创建的各种其他Hadoop进程处理及其对RAM使用的影响(参见:https://forums.aws.amazon.com/thread.jspa?threadID=49024)从单机集群到双机集群,如何应对变化? 最佳答案 时间已经过去,没有人试图制定一个答案。所以我会提出一些