草庐IT

input-container

全部标签

java - Hive StorageHandler 抛出异常 "Configuration and input path are inconsistent"

我有一个HiveStorageHandler如果我执行select*frommyTable它会返回底层存储中的所有行。当我执行类似selectcol1frommyTable的操作时,底层mapreduce作业会抛出异常:java.lang.RuntimeException:Errorinconfiguringobjectatorg.apache.hadoop.util.ReflectionUtils.setJobConf(ReflectionUtils.java:109)atorg.apache.hadoop.util.ReflectionUtils.setConf(Reflectio

Hadoop 流与 Python : splitting input files manually

我是Hadoop的新手,正在尝试将其流功能与Python编写的映射器和缩减器一起使用。问题是我的原始输入文件将包含要由映射器识别的行序列。如果我让Hadoop拆分输入文件,它可能会在序列的中间进行拆分,因此不会检测到该序列。所以,我正在考虑手动拆分文件。这也将打破一些序列,因此,除此之外,我还将提供替代拆分,以创建与“第一个”拆分重叠的文件。这样我就不会丢失任何序列。我将运行thisarticle中描述的以下命令:hduser@ubuntu:/usr/local/hadoop$bin/hadoopjarcontrib/streaming/hadoop-*streaming*.jar\-

hadoop - HDFS NFS 网关 mount.nfs : Input/output error?

HDFSNFSGateWaymount.nfs:输入/输出错误?1.报错如下:[root@xxsbin]#mount-tnfs-overs=3,proto=tcp,nolock,noacl,synclocalhost://hdfs_ymount.nfs:Input/outputerror2016-03-1015:12:06,350WARNorg.apache.hadoop.hdfs.nfs.nfs3.RpcProgramNfs3:Exception804org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.security.au

java - mapreduce.input.keyvaluelinerecordreader.key.value.separator参数在hadoop安装中的位置

我在java中使用mapreduce来读取由“:”分隔的键值类型文件。我想出了如何解析文件(使用getConf().set("mapreduce.input.keyvaluelinerecordreader.key.value.separator",":");)。我试图找出存储这些参数的位置但找不到。我在hadoop安装上做了一个grep,但是没有设置这些参数的xml文件。根据documentation配置类,我试图在mapred-default.xml中找到该值,但没有成功。我在哪里可以找到这些值?其他一些参数也是如此。谢谢。 最佳答案

hadoop - Spark 1.6.2 & yarn : diagnostics: Application failed 2 times due to AM Container for exited with exitCode: -1

我有一个由2台机器组成的集群,我正在尝试使用YARN集群管理器提交一个spark作业。基于hadoop2.6.2构建的vanillaSpark1.6.2普通Hadoop2.7.2我可以使用独立的集群管理器成功运行map-reduce作业和spark作业。但是当我用YARN运行它时,我得到了一个错误。对如何让它发挥作用有什么建议吗?如何启用更详细的日志记录?错误信息绝对不清楚为什么在hadoop/logs/userlogs/applicationXXX下没有创建日志文件?反问:IMO:hadoop日志记录和诊断不是很好。这是为什么?Hadoop似乎是一个成熟的产品。下面是输出:mike@

hadoop - Flume 与 SLF4J : Class path contains multiple SLF4J bindings 冲突 hadoop

每次启动Flume时,我都会在Flume、Hive和Hadoop之间收到此消息。避免这种情况的最佳方法是什么?我正在考虑从flumelib目录中删除一个jar,但不确定这是否会影响其他(hive、hadoop)。Info:Sourcingenvironmentconfigurationscript/usr/local/flume/conf/flume-env.shInfo:IncludingHadooplibrariesfoundvia(/usr/local/hadoop/bin/hadoop)forHDFSaccess+exec/usr/java/jdk1.7.0_79/bin/ja

hadoop - 如何减少 Hadoop Yarn Container 生成的日志量?

我正在使用Hadoop2.7.3,使用Yarn进行一些mapreduce。每个容器生成的日志都是天文数字。明显使用的级别是DEBUG。我想将日志级别提高到INFO。我的安装或多或少是默认安装。我尝试修改hadoop-yarn-server-nodemanager-*.jar中的container-log4j.properties,如https://community.hortonworks.com/questions/98259/hdp-250-how-to-override-default-container-log4j-in.html中所述但这没有帮助。我的每个容器的标准输出文件都

java - 失败 : ParseException line 1:94 mismatched input 'hdfs' expecting StringLiteral near 'location' in partition location

Java代码:Stringcmd0="hive-e\"use"+hiveuser+";sethive.exec.compress.output=true;setmapred.output.compression.codec=com.hadoop.compression.lzo.LzopCodec;setmapreduce.job.queuename="+queue+";altertable"+"resident_tmp"+"addifnotexistspartition(weekday='"+"weekday=20170807"+"')location"+location+"\"";C

hadoop - SAS Hive (Hadoop) 中是否有 Contains 函数?

我又需要帮助了是否有与SASHadoop中的Contains函数等效的函数(显式SQL直通)?例如替代版本:WHENa.DESCRIPTIONNOTCONTAINS"XXX"我尝试使用:When(array_contains(a.DESCRIPTION,'XXX')=FALSE)但这不起作用。欢迎任何帮助! 最佳答案 感谢Kiran建议使用instr函数....看起来它满足了我的需要所以我曾经得到我想要的:Wheninstr(a.DESCRIPTION,'XXX')=0Then1Mayank....谢谢你的建议,我稍后会研究这个功能

hadoop - 组织.apache.ignite.IgniteException : For input string: "30s" in ignite hadoop execution

我想在apacheignite上执行Hadoop的字数统计示例。我在ignite中使用IGFS作为HDFS配置的缓存,但是在通过Hadoop提交作业以在ignite上执行后,我遇到了以下错误。提前感谢任何可以帮助我的人!Usingconfiguration:examples/config/filesystem/example-igfs-hdfs.xml[00:47:13]__________________________[00:47:13]/_/___/|//_/___/__/[00:47:13]_///(77//////_/[00:47:13]/___/\___/_/|_/___/