草庐IT

deselect_all

全部标签

hadoop - 使用 start-all.sh 启动 Hadoop 时出错

使用strat-all.sh启动Hadoop时出现如下错误:2012-06-2819:51:56,655FATALorg.apache.hadoop.mapred.JobTracker:java.lang.IllegalArgumentException:Doesnotcontainavalidhost:portauthority:localhost:54311atorg.apache.hadoop.net.NetUtils.createSocketAddr(NetUtils.java:147)atorg.apache.hadoop.net.NetUtils.createSocketA

hadoop - 运行 pig 脚本给出错误 : job has failed. Stop running all dependent jobs

我需要帮助来了解为什么在运行pig脚本时出现错误。但是当我在较小的数据中尝试相同的脚本时,它会成功执行。有几个类似问题的问题,但没有一个有解决方案。我的脚本是这样的:A=load‘test.txt’usingTextLoader();B=foreachAgenerateSTRSPLIT($0,’”,”’)ast;C=FILTERBBY(t.$1==2andt.$2matches‘.*xxx.*’);StoreCintotemp;错误是:org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.MapReduceLaunch

hadoop - 我不明白 CapacityScheduler 中的 "The sum of capacities for all queues, at each level, must be equal to 100"

在http://hadoop.apache.org/docs/r2.3.0/hadoop-yarn/hadoop-yarn-site/CapacityScheduler.html,我看见了yarn.scheduler.capacity..capacity:Queuecapacityinpercentage(%)asafloat(e.g.12.5).Thesumofcapacitiesforallqueues,ateachlevel,mustbeequalto100.Applicationsinthequeuemayconsumemoreresourcesthanthequeue'sca

regex - 使用 REGEX_EXTRACT_ALL 但投影我得到 "()"

我正在使用Cloudera-quickstat5.4。我有一个文件,每一行都有数据,例如:323.81.303.680--[25/Oct/2011:01:41:00-0500]"GET/download/download6.zipHTTP/1.1"2000"-""Mozilla/5.0(Windows;U;WindowsNT5.1;en-US;rv:1.9.0.19)Gecko/2010031422Firefox/3.0.19"在apachepig中,我使用的脚本如下:A=LOAD'weblog.txt'usingTextLoader()as(line:chararray);B=FOR

sql - UNION ALL 不会在 Hive 中生成任何数据

我正在尝试对具有相同DDL结构的三个不同表执行UNIONALL,但最终输出生成零行。我不知道底层执行中发生了什么。有人可以分享您对此的看法吗?我的示例HiveSQL如下所示。谢谢。SEThive.execution.engine=tez;SEThive.exec.dynamic.partition.mode=nonstrict;SEThive.qubole.cleanup.partial.data.on.failure=true;SEThive.tez.container.size=8192;SETtez.task.resource.memory.mb=8192;SETtez.task

hadoop - Cassandra 升级 0.8.2->0.8.4 出现错误 "failed connecting to all endpoints"

cassandra从0.8.2升级到0.8.4后出现这个错误我已经重新启动了cassandra,删除了数据等。没有任何帮助在它运行良好之前,我在云中有6台相同的机器。如果我做netstat那么它显示端口9160监听nodetool...ring-响应6台机器UP。可能是什么问题?:(线程“main”中的异常java.io.IOException:无法获取输入拆分在org.apache.cassandra.hadoop.ColumnFamilyInputFormat.getSplits(ColumnFamilyInputFormat.java:157)在org.apache.hadoop

hadoop - 运行 hadoop start-all.sh 出错

我想在我的archlinux上运行hadoop,但我遇到了这个错误,我该如何解决?[]#./usr/lib/hadoop-2.2.0/sbin/start-all.shThisscriptisDeprecated.Insteadusestart-dfs.shandstart-yarn.shIncorrectconfiguration:namenodeaddressdfs.namenode.servicerpc-addressordfs.namenode.rpc-addressisnotconfigured.Startingnamenodeson[OpenJDK64-BitServerV

bash - Hadoop 启动-all.sh 错误 :No such file or directory

我在成功创建名称节点后,在尝试启动名称节点时遇到了这个问题。对我来说,它似乎正在尝试登录到一个不存在的文件。我如何更改我的设置以将脚本日志定向到正确的目录?bash-3.2$start-all.shstartingnamenode,loggingto/usr/local/bin/../logs/hadoop-Yili-namenode-wifi169-116.bucknell.edu.outnice:/usr/local/bin/../bin/hadoop:Nosuchfileordirectorylocalhost:startingdatanode,loggingto/usr/loc

hadoop - NameNode 不以 start-all.sh 开头

在stop-all.sh和start-all.sh之后,NameNode没有启动。我尝试hadoopnamenode-format和hadoop-daemon.sh启动namenode然后一切正常。但是我的数据在HDFS中丢失了。我不想丢失数据。这样的结果,hadoopnamenode-format命令不是我想解决的路径。如何使用start-all.sh启动NameNode?谢谢 最佳答案 首先,stop-all.sh和start-all.sh已弃用。使用start-dfs.sh和start-yarn.sh而不是start-all.

sql-server - Sqoop import-all-tables 命令的问题

我正在尝试使用Sqoop将多个SQLServer数据库中的所有表导入HDFS。我正在使用ClouderaCDH5.7。所以我输入以下命令:sqoopimport-all-tables--connect"jdbc:sqlserver://X.X.X.X:1433;database=FEPDB"--usernameXXXXX--passwordXXXXX--hive-import它运行成功,但“FEPDB”数据库中的所有表都没有被导入。我没有在HDFS的配置单元目录中找到它们,也没有在列出Hive中存在的所有表时找到它们。所以我尝试将所有表导入HDFS中的一个目录,然后创建hive表。我给