草庐IT

ERROR_DIRECTORY

全部标签

hadoop - Spark : Out Of Memory Error when I save to HDFS

我在保存大数据到hdfs时出现OOMEvalaccumulableCollection=sc.accumulableCollection(ArrayBuffer[String]())valrdd=textfile.filter(row=>{if(row.endsWith(",")){accumulableCollection+=rowfalse}elseif(row.length{varvalid=truefor((k,v)我在spark-submit中使用这个:--num-executors2--driver-memory1G--executor-memory1G--executor

Hadoop : ClassNotFound Error at MapReduce

只是在提出问题之前说明我的设置,HadoopVersion:1.0.3默认的WordCount示例运行良好。但是当我根据这个页面http://hadoop.apache.org/common/docs/r0.20.2/mapred_tutorial.html创建一个新的WordCount程序时我按照教程中给出的类似方式对其进行了编译和jar压缩。但是当我运行它时使用:/usr/local/hadoop$bin/hadoopjarwordcount.jarorg.myorg.WordCount../Space/input/../Space/output我得到以下错误,java.lang.

hadoop - 亚马逊弹性 MapReduce : Output directory

我正在运行Amazon的运行ElasticMapReduce的示例,并不断遇到以下错误:Errorlaunchingjob,Outputpathalreadyexists.这是运行我正在使用的作业的命令:C:\ruby\elastic-mapreduce-cli>rubyelastic-mapreduce--create--stream\--mappers3://elasticmapreduce/samples/wordcount/wordSplitter.py\--inputs3://elasticmapreduce/samples/wordcount/input\--output[

hadoop - 马克逻辑 : Error while importing files using MLCP

我尝试使用以下命令在生产环境中运行的MarkLogic服务器中使用MarkLogic内容泵导入文件。C:\Users\Admin\Desktop\mlcp-1.3-3\bin>mlcp.batimport-hostlocalhost-port8891-usernameadmin-passwordadmin-modelocal-input_file_typearchive-input_file_path/d:/NewFolder/输入文件路径同时包含二进制文件和XML文件。"D:\NewFolder\20150626200126+0800-000000-BINARY.zip""D:\Ne

【已解决】Error response from daemon: Get https://index.docker.io/v1/search?q=zookeeper&n=25: dial tcp: l

已解决:Errorresponsefromdaemon:Gethttps://index.docker.io/v1/search?q=zookeeper&n=25:dialtcp:lookupindex.docker.ioon192.168.xxx.x:xx:readudp192.168.xx.xx:xxxxx->192.168.xx.xx:xxxx:i/otimeoutdocker安装技术栈报错问题原因一:镜像源时国外的,下载被限制问题原因二:网络原因连接不通)docker安装技术栈报错在从Docker上pull镜像的时候遇到了如下问题:Gethttps://registry-1.docke

hadoop - curl : (5) Could not resolve proxy: DELETE; Unknown error

我在centos7上使用hadoopapache2.7.1,我想使用webhdfs命令删除文件(file1)。curl-i-xDELETE"http://192.168.25.21:50070/webhdfs/v1/hadoophome/file1/?user.name=root&op=DELETE&recursive=true"但是我收到了这个错误:curl:(5)Couldnotresolveproxy:DELETE;Unknownerror我按如下方式编辑了bashrc文件:exporthttp_proxy=""exporthttps_proxy=""exportftp_prox

java - Apache Spark : TaskResultLost (result lost from block manager) Error On cluster

我在Virtualbox上有一个带有3个从节点的Spark独立集群。我的代码在Java上,它可以很好地处理我的小输入数据集,它们的输入总共大约100MB。我将我的虚拟机RAM设置为16GB,但是当我在大输入文件(大约2GB)上运行我的代码时,在我的reduce部分处理数小时后出现此错误:Jobabortedduetostagefailure:Totalsizeofserializedresultsof4tasks(4.3GB)isbiggerthanspark.driver.maxResultSize`我编辑了spark-defaults.conf并为spark.driver.maxR

Hadoop hive : How to allow regular user continuously write data and create tables in warehouse directory?

我在单个节点上运行Hadoop2.2.0.2.0.6.0-101。我正在尝试运行JavaMRD程序,该程序在普通用户下从Eclipse将数据写入现有的Hive表。我得到异常:org.apache.hadoop.security.AccessControlException:Permissiondenied:user=dev,access=WRITE,inode="/apps/hive/warehouse/testids":hdfs:hdfs:drwxr-xr-x发生这种情况是因为普通用户对仓库目录没有写权限,只有hdfs用户有:drwxr-xr-x-hdfshdfs02014-03-0

hadoop - 本地主机 : ERROR: Cannot set priority of datanode process 32156

我正在尝试在ubuntu16.04上安装hadoop但是在启动hadoop时它会给我以下错误localhost:ERROR:Cannotsetpriorityofdatanodeprocess32156.Startingsecondarynamenodes[it-OptiPlex-3020]2017-09-1821:13:48,343WARNutil.NativeCodeLoader:Unabletoloadnative-hadooplibraryforyourplatform...usingbuiltin-javaclasseswhereapplicableStartingresou

java - HADOOP HTTPFS : giving error "User: ubuntu is not allowed to impersonate ubuntu" while accessing the application through Http

我在我的集​​群上安装了hadoop1.0.4,有1个主机和3个从机,现在我正在安装HTTPFS(hadoop-hdfs-httpfs-0.20.2-cdh3u5-SNAPSHOT)以使用http协议(protocol)访问HDFS内容,我可以通过它访问正常的页面curl-i"http://myhost:14000"它工作正常:)但是如果我尝试访问HDFS然后它给我错误(ubantu是我的用户):(curl-i"http://myhost:14000/webhdfs/v1?user.name=ubantu&op=OPEN"错误:{"RemoteException":{"message"