草庐IT

tsk_fs_open_img

全部标签

hadoop - fs.http.address ip 更改后,cloudera vm hadoop Hive 失败

我正在使用ClouderaVM(cdh3u2)作为模拟的分布式文件系统。为了从Web服务器执行文件创建和写入,我更改了fs.http.address属性以指向VMIP。此功能工作正常。当HIVE执行类似mapreduce的作业时,问题就出现了SELECTCOUNT(*)FROMtmp2;我得到的信息是:hive>selectcount(*)fromtmp2;TotalMapReducejobs=1LaunchingJob1outof1Numberofreducetasksdeterminedatcompiletime:1Inordertochangetheaverageloadfora

Hadoop FS 分隔符

我正在尝试使用hadoopfs-copyToLocal将表复制到文件。该命令运行顺畅,减去我所有字段合并在一起的事实。有没有办法指定分隔符? 最佳答案 我已经看到完全相同的问题,将Hive表复制到本地文件系统会将所有字段添加到一个巨大的行中,并且在表中每一行的末尾不接受'\n'字符。您最好的选择是使用自定义SerDe(Serializer和DeSerializer)将配置单元导出到CVS,如所述here.您可以从github获取源代码以及。 关于HadoopFS分隔符,我们在StackO

hadoop - "Spring XD"xd-shell无法运行hadoop fs ls命令,命令返回java异常

我编译了最新的spring-xd因为我需要CDH支持。我能够启动服务器,但是当我通过xd-shell连接到服务器时,我尝试更改“配置”。这也是一个kerberized集群,我不确定xd将如何处理它。第一种情况:管理配置服务器--urihttp://testdomain:10111hadoopconfigfs--namenodehdfs://nameservice1:8020hadoop配置Prop设置hadoop.security.group.mapping=org.apache.hadoop.security.ShellBasedUnixGroupsMappinghadoop配置Pr

hadoop - 如何解决 talend open studio for Big data 中的 tHDFS 组件问题

我通过OracleVMVirtualBox安装了HortonWorksSandbox2.1,然后尝试按照使用Talend的tHDFS组件的示例进行操作,但出现以下错误:https://plus.google.com/u/0/115961411938996992246/posts/JygQvMgwEBz?pid=6084505570738968834&oid=115961411938996992246我的工作布局看起来像. 最佳答案 按照以下步骤在OracleVMVirtualBox中解决了该问题:转到File-->Preferenc

java - 创建项目时 Talend Open Studio 大数据错误

我为BigData6.0安装了TalendOpenstudio,但在创建项目时弹出以下错误。我安装了Java,版本是1.7.0_65。如果有任何问题需要修复,请告诉我。java.lang.NullPointerExceptionatorg.talend.designer.codegen.JavaRoutineSynchronizer.doSyncRoutine(JavaRoutineSynchronizer.java:145)atorg.talend.designer.codegen.AbstractRoutineSynchronizer.syncRoutine(AbstractRou

python - 在 python 代码中使用 hadoop fs -put 命令将文件从本地文件系统传输到 hdfs 的问题

我在python中使用这段代码,它从文件中读取记录,对它们进行一些处理,然后将结果写入一个新文件。然后我将文件从我的本地文件系统传输到hdfs:read=open('file_read.txt','r')forlineinread:fields=line.split('|')columns.append(fields)category=[-1,1,2,3,4,5,6]out=open('file_write.txt','w')forlineincolumns:out.write('{0}|{1}|{2}|{3}'.format(line[0],line[1],line[5],line[

windows - 在没有 Cygwin 的情况下,如何在 WIndows cmdline 上将文件传输到 Hadoop FS (HDFS)?

我对Hadoop的经验为零,但突然不得不在Windows上与Spark一起使用它。我的问题在这里被问过几次,但我永远无法完全理解我需要的语法,是这个。我正在尝试传输一个名为:gensortText.txt假设在c:\gensortText.txt我知道您可以使用hadoopfs-copyFromLocal。我试过这些东西:hadoopfs-copyFromLocalC:\gensortText.txthdfs://0.0.0.0:19000ERROR:RelativepathinabsoluteURI.hadoopfs-copyFromLocalC:\gensortOutText.tx

java.lang.NoClassDefFoundError : ./oozie-setup.sh sharelib 创建-fs hdfs://localhost:9000

我构建了Oozie并在hdfs中创建共享库,但它给出了以下错误。我按照所有步骤操作,但这是唯一出错的步骤。settingCATALINA_OPTS="$CATALINA_OPTS-Xmx1024m"Exceptioninthread"main"java.lang.NoClassDefFoundError:org/apache/commons/io/filefilter/IOFileFilteratjava.lang.Class.getDeclaredMethods0(NativeMethod)atjava.lang.Class.privateGetDeclaredMethods(Cla

hadoop - pig 中的 "unable to open iterator for an alias"是什么意思?

我正在尝试使用联合运算符,如下所示uni_b=UNIONA,B,C,D,E,F,G,H;这里所有的关系A,B,C...H都具有相同的模式当我使用dump运算符时,直到85%运行正常..之后它显示以下错误..ERROR1066:Unabletoopeniteratorforaliasuni_b这是什么?问题出在哪里?我应该如何调试?这是我的pig脚本...ip=load'/jee/jee_data.txt'USINGPigStorage(',')as(id:Biginteger,fname:chararray,lname:chararray,board:chararray,eid:cha

Hadoop:hadoop fs -put error MSG:[ 有 2 个数据节点正在运行,2 个节点被排除在该操作中。]

enterimagedescriptionhere我已经安装了hadoop2.6.5,当我尝试将文件从本地放到hdfs时,出现了这个异常,我不知道如何解决这个问题!!需要帮助... 最佳答案 这将是一个网络问题。客户端进程(您运行hdfsdfs-put命令的位置)无法连接到DataNode主机。我可以从堆栈跟踪中看出,此时,您已经通过了与NameNode交互的点,因此从客户端到NameNode的连接很好。我建议将此作为客户端和所有DataNode主机之间的基本网络连接故障排除问题来处理。使用ping或nc或telnet等工具来测试连