hadoop-release

hadoop - 集群安装卡在cloudera manager中的 "installation in progress"

我已经在ubuntu操作系统中安装了Clouderamanager5.4版本。当我尝试使用cloudera管理器安装集群时，它卡住了“正在安装”，没有任何错误。我只能从/var/log/cloudera-scm-server/cloudera-scm-server.log中看到两个错误2015-05-1219:11:42,715ERRORmain:org.hibernate.engine.jdbc.spi.SqlExceptionHelper:ERROR:relation"cm_version"doesnotexistPosition:212015-05-1219:16:58,585E

java - 尝试在 shell 脚本中同时运行 hadoop MapReduce 命令和 linux 命令

我有一个这样的shell脚本。#!/bin/sh/home/hduser/Downloads/hadoop/bin/stop-all.shecho"RUNNINGHADOOPPROGRAM"cd/home/hduser/Downloads/hadoopsudorm-R/tmp/*sudorm-R/app/*cdsudomkdir-p/app/hadoop/tmpsudochownhduser:hadoop/app/hadoop/tmpsudochmod750/app/hadoop/tmphadoopnamenode-format/home/hduser/Downloads/hadoop

MapReduce hadoop hduser Downloads java shell

hadoop - Spark 错误 : Server IPC version 9 cannot communicate with client version 4

我运行的是hadoop2.7.0版本、scala2.10.4、java1.7.0_21和spark1.3.0我创建了一个如下所示的小文件hduser@ubuntu:~$cat/home/hduser/test_sample/sample1.txtEid1,EName1,EDept1,100Eid2,EName2,EDept1,102Eid3,EName3,EDept1,101Eid4,EName4,EDept2,110Eid5,EName5,EDept2,121Eid6,EName6,EDept3,99运行以下命令时出现错误。scala>valemp=sc.textFile("/hom

version communicate section sample EName hadoop apache-spark

hadoop - Hadoop 中的元数据扩展

是否有一种内置机制可以将额外的元数据标记到HDFS文件并根据标记信息检索文件？假设我想在数据中添加企业级信息，是否可以在Hadoop中实现，或者我们是否需要其他框架最佳答案这可能对你有用QueryIO提供高级手动和自动数据标记功能，允许您在将文件写入HDFS时为其定义属性。它自动存储存储在HDFS中的基本元数据文件，并通过使您能够定义额外的元数据来进一步扩展元数据层。支持pdf/xls/doc文件格式、图片文件、音视频文件等数十种文件格式。http://www.slideshare.net/QueryIO/hadoop-data

hadoop section hadoop-data-tagging-and-metadata-QueryIO tags metadata

hadoop - 安全 Hadoop - Datanode 无法连接到 namenode

我正在使用hadoop-2.6.0并在Windows平台上创建了具有kerberos安全性的HA启用集群。如果权限设置为false，一切正常。但是当我启用以下属性时，hdfs-site.xmldfs.permissionstrueDatanode无法连接到namenode。我收到以下异常异常2015-05-2110:44:42,461WARNorg.apache.hadoop.hdfs.server.datanode.DataNode:Problemconnectingtoserver:kumar/192.168.3.4:90002015-05-2110:44:46,079WARNor

Datanode namenode hadoop server section kerberos hadoop2

Hadoop:每个 tar/zip 文件一个映射器

我有几个要计算统计信息的目录。即我的映射器函数将一个文件夹树作为输入，并根据目录及其所有子目录的内容吐出一些静态信息。每个目录的计算都需要很长时间。没有reducer。我可以为每个要处理的目录创建一个tar/zip文件，并将其复制到HDFS中。但是我如何确保为每个tar文件创建一个映射器并将tar文件的全部内容发送到该映射器(以便我可以遍历tar文件的内容并生成该文件的统计信息)？如果可能，我更愿意在HadoopStreaming中执行此操作。可以这样做吗？最佳答案我认为您在HDFS中有许多tar/zip文件作为您的map/re

射器 Hadoop section tar hadoop-streaming

hadoop - 命令 'oozie admin sharedliblist ...' 的空共享库

我已经按照此处的说明安装了oozie并安装了共享库http://mockus.in/forum/viewtopic.php?t=48当我运行伴随安装的示例MapReduceWorkflow时，工作流失败了。在webconsole日志中，我可以看到此错误消息2015-05-2418:09:32,664WARNActionStartXCommand:544-SERVER[mountain]USER[mountain]GROUP[-]TOKEN[]APP[map-reduce-wf]JOB[0000000-150524175852032-oozie-moun-W]ACTION[0000000

sharedliblist amp mountain oozie lib hadoop

hadoop - 在 ubuntu 上的 eclipse 中运行 Hbase 示例

我是Hbase和Hadoop的新手。我在Ubuntu中以伪模式设置Hadoop(1.2.1)和hbase(0.94.27)。我还使用habseshell成功创建或插入数据到hbase表。但是当我尝试编写一个简单的程序通过在Eclipse中使用JavaAPI向表中插入数据时publicclassHbaseTest{publicstaticvoidmain(String[]args)throwsException{Configurationconf=HBaseConfiguration.create();HBaseAdminadmin=newHBaseAdmin(conf);try{HTa

中运 eclipse zookeeper gt ClientCnxn hadoop hbase

java - 如何在 Hadoop 上的 OpenNLP 中训练意大利语模型？

我想在Hadoop上为意大利语实现一个自然语言处理算法我有两个问题；如何找到意大利语的词干提取算法？如何集成到hadoop中？这是我的代码StringpathSent=...taggedsentences...;StringpathChunk=....chunkedtrainpath....;FilefileSent=newFile(pathSent);FilefileChunk=newFile(pathChunk);InputStreaminSent=null;InputStreaminChunk=null;inSent=newFileInputStream(fileSent);in

意大利语利语 new 34 section java hadoop nlp opennlp linguistics

hadoop - 无法在 WebHdfs 中创建目录或文件

HortonworksSandbox文件浏览器显示WebHdfsException，并且在CLI中我无法创建目录或文件。怎么了？WebHdfsExceptionat/filebrowser/RequestMethod:GETRequestURL:http://127.0.0.1:8000/filebrowser/DjangoVersion:1.2.3ExceptionType:WebHdfsExceptionExceptionValue:异常位置:/usr/lib/hue/desktop/libs/hadoop/src/hadoop/fs/webhdfs.pyin_stats,line

WebHdfs hadoop lib site-packages 39 hdfs hortonworks-data-platform

157 158 159160161 162 163