hadoop-release

hadoop - Vertica:输入记录 1 已被拒绝(找到的列太少)

我正在尝试将文件从Hadoop复制到Vertica表，但出现错误。问题是相同的副本有时通过有时失败，知道吗？错误:Causedby:java.sql.SQLException:[Vertica]VJDBCERROR:COPY:Inputrecord1hasbeenrejected(Toofewcolumnsfound)atcom.vertica.util.ServerErrorData.buildException(UnknownSource)atcom.vertica.dataengine.VResultSet.fetchChunk(UnknownSource)atcom.verti

java - Hadoop - reducer 未启动

我正在尝试在Hadoop2.6.0上为单节点集群运行开源kNN加入MapReducehbrj算法-我的笔记本电脑(OSX)上安装了伪分布式操作。这是代码。Mapper、reducer和主驱动:publicclassRPhase2extendsConfiguredimplementsTool{publicstaticclassMapClassextendsMapReduceBaseimplementsMapper{publicvoidmap(LongWritablekey,Textvalue,OutputCollectoroutput,Reporterreporter)throwsIOE

reducer Hadoop numberOfPartition 34 args java knn

hadoop - 在 Oozie 中为 Map-Reduce 作业指定驱动程序

${jobTracker}${nameNode}mapred.input.dir${inputDir}mapred.output.dir${outputDir}mapred.job.queue.name${queueName}mapred.reduce.tasks${numberofReducers}mapred.reducer.new-apitruemapred.mapper.new-apitrueMap/Reducefailed,errormessage[${wf:errorMessage(wf:lastErrorNode())}]我正在尝试使用Oozie运行map-reduce作

Map-Reduce 驱动 lt gt property hadoop mapreduce oozie

azure - 如何从 Hadoop 中的 Azure Blob 存储读取数据？

我有一个map-reduce作业，reducer获取驻留在AzureBlob存储上的文件的绝对地址，reducer应该打开它并读取其内容。我在配置Hadoop集群(HDInsight)时添加了包含文件的存储帐户。因此，reducer必须有权访问此Blob存储，但因为Blob存储不是我工作的默认HDFS存储。我的reducer中有以下代码，但它给了我一个FileNotFound错误消息。FileSystemfs=FileSystem.get(newConfiguration());Pathpt=newPath("wasb://mycontainer@accountname...");FS

Hadoop azure section reducer mycontainer azure-storage azure-hdinsight

hadoop - Impala 不在 Hbase 表上工作

您好，我有一个Hbase表，我可以使用Hive查询该表。当我尝试从impala(从HUE或shell)访问相同内容时，出现以下错误:Query:select*fromclickviewERROR:RuntimeException:couldn'tretrieveHBasetable(clickviewtab)info:Enable/DisablefailedCDH版本-cdh5.4.2Impala版本-2.2.0Hbase版本-1.0.0-cdh5.4.2所有Hbase、impala和hive都是CDH5.4.2版本的一部分，并作为软件包安装。最佳答案

上工 hadoop section strong Impala hbase nosql

hadoop - Hive Oozie 错误处理

有没有人对Oozie异常/错误处理的最佳实践有什么建议？我们在Oozie工作流中有HiveActions，发现错误没有足够详细地记录。我们需要更多的堆栈跟踪和每个失败的更多上下文。有什么建议吗？提前致谢...喜满树最佳答案一旦oozie作业提交，Yarn将负责完成mapreduce的操作。作业提交到yarn后，检查mapredhistoryserver中的日志，或者通过oozie中的作业日志以及webUI中的错误代码列表进行检查。关于hadoop-HiveOozie错误处理，我

hadoop Oozie section strong stackoverflow error-handling hive bigdata

hadoop - 为什么我们在hadoop中使用分布式缓存？

无论如何，mapreduce框架中有很多跨节点的文件传输。那么分布式缓存的使用是如何提高性能的。最佳答案 DistributedCache是Map-Reduce框架提供的一种设施，用于缓存应用程序所需的文件。一旦你为你的工作缓存了一个文件，hadoop框架将使它在你运行映射/reducetask的每个数据节点(在文件系统中，而不是在内存中)上可用。文件通过网络传输，通常通过HDFS。与将HDFS用于任何非数据本地任务相比，它不会对网络造成更多压力。关于hadoop-为什么我们在had

hadoop 为什么 section stackoverflow mapreduce hdfs reduce distributed-cache

parsing - Hadoop Informatica 日志处理

我正在从事一个项目，该项目涉及从相当大的Informatica日志文件创建一组可查询的数据。为此，使用Flume将文件导入到Hadoop集群中，该集群在我开始此项目之前已由同事配置。我的工作是根据日志中包含的数据创建一个表，以便可以轻松地执行查询。我遇到的问题与日志文件格式有关。日志的格式为:时间戳:严重性:(Pid|线程):(服务类型|服务名称):客户端节点:消息代码:消息问题是有时消息字段包含额外的冒号分隔注释，例如消息可能是[x:y:z]。使用HCatalog创建表时，我无法解释这种行为，而是会产生额外的列。有什么建议吗？通常我会使用Ruby来分隔字段或替换分隔符以在使用HCat

Informatica parsing section 中包志文 hadoop logging

hadoop - 从多个链接访问 hadoop 节点 web UI

我正在为hadoop的节点webui访问使用以下设置:dfs.namenode.http-address:127.0.0.1:50070通过它我只能从本地机器访问节点webui链接:http://127.0.0.1:50070有什么方法可以让我也可以从外部访问它吗？像这样说:http://:50070提前致谢!! 最佳答案您可以使用主机名或IP地址代替localhost/127.0.0.1。确保您可以从远程计算机ping主机名或ip。如果你能ping通它，那么你就可以访问webui。要ping一下打开命令/终端在远程机器上输入以下

hadoop web section code pre

java - Hadoop MultipleInputs，具有不同分隔符的TextInputFormat

如何最简单地运行多个不同的映射器类(使用MultipleInputs)，所有映射器类都使用相同的输入格式，但使用不同的输入分隔符？MultipleInput允许您添加多个映射器，每个映射器都有自己的输入格式:MultipleInputs.addInputPath(Jobjob,Pathpath,ClassinputFormatClass,ClassmapperClass)TextInputFormat输入中的输入分隔符是通过在作业配置中设置配置键textinputformat.record.delimiter来配置的。方便!但是，这意味着使用MultipleInput.addInput

TextInputFormat MultipleInputs 射器 code section java hadoop mapreduce

159 160 161162163 164 165