ql-author

hadoop - Hadoop DataNode 错误 : host:port authority

伙计们。当我尝试运行hadoop集群时，但我没有成功。主要错误是这样的:但奇怪的是，除了dataNode，NameNode、JobTracker、SecondNameNode和TaskTracker都没问题。我的其他配置是这样的:hdfs-site.xml核心站点.xmlmapred-site.xml 最佳答案我不确定它是否有帮助，但是checkthispage从那里引用，EventhoughtIconfiguredthecore-site.xml,mapred-site.xml&hdfs-site.xmlunder/usr/lo

hadoop - 无法启动 TaskTracker.Says 无法启动任务跟踪器，因为 java.lang.IllegalArgumentException : Does not contain a valid host:port authority:

编辑了mapred-site.xml、core-site.xml、hadoop-env.sh、hdfs-site.xml、masters和slaves。我有1个DataNode和2个Namenode。它们都成功启动，我可以在浏览器中看到它们。启动了start-mapred.sh并在Namenode上启动了JobTracker和TaskTracker，但无法在datanaode上启动Tasktracker。启动Tasktracker，输出如下。->hadooptasktrackerWarning:$HADOOP_HOMEisdeprecated.13/10/1703:21:55INFOm

跟踪器 IllegalArgumentException TaskTracker mapred hadoop ubuntu-12.04

hadoop - Hive QL 中的条件 GROUP BY 子句

我正在尝试在HiveQL脚本中参数化GROUPBY子句。SELECTCOUNT(*)ASsales,country,state,cityFROMtestdb.dataWHEREPRICE>5GROUPBYIF(TRUE,(country,state,city),(country,state))如何实现这样的查询？最佳答案我曾尝试在GROUPBY及其作品中使用CASE语句。不过，您可能想要验证查询结果。如果您可以将您的条件转换为case语句，则此查询可以工作。SELECT*FROMtestdb.dataWHEREprice>5GR

hadoop GROUP section country mapreduce hive cloudera hiveql

hadoop - hive QL : split column into 2 columns and rank each column

代码selectc1,c2,c3,c4,c5,c6fromtablewherec5in('a','b')从这里开始，我想将c5列拆分为两列，然后根据它们对c6的值对它们进行排名。一列应该由所有a结果组成，另一列应该是所有b结果。我已经能够使用rank()对它们进行排名，但无法将列分开。我还没有得到其他人曾经为我工作的技术。最佳答案 selectc1,c2,c3,c4,c5,c6,rank()over(partitionby...orderbycasewhenc5='a'then1casewhenc5='b'then2end)asr

column columns section code 39 hadoop hive

hadoop - 在配置单元 "Unable to retrieve URL for Hadoop Task logs. Does not contain a valid host:port authority: local"上出现错误

在涉及mapreduce的hive上执行任何查询时，我收到此错误。“UnabletoretrieveURLforHadoopTasklogs.Doesnotcontainavalidhost:portauthority:local” 最佳答案报告的异常出现在旧版本的Hadoop中(即YARN之前)。大多数情况下，您使用的是旧版本的Hadoop。当mapred.job.tracker的值出现异常参数在local中设置为“mapred-site.xml”相反，它应该是:. 关于hadoop

配置单 amp section code Hadoop hive

hadoop - Hive 在尝试从表中选择时显示 org.apache.hadoop.hive.ql.metadata.HiveException

我试着按照这个documentation当我到达创建外部表步骤时:创建外部表ams_audit_trail(job_id整数、application_id整数、操作字符串)由'org.apache.hadoop.hive.dynamodb.DynamoDBStorageHandler'存储TBLPROPERTIES("dynamodb.table.name"="ams_audit_trail","dynamodb.column.mapping"="job_id:job_id,application_id:application_id,actions:actions");当我尝试从中选择

时显 hadoop section job_id ams_audit_trail hive amazon-dynamodb

linux - fedora 中没有 authorized_keys 文件

您好，我正在我的机器上安装hadoop，我创建了一个新组和组下的一个用户[hduser@localhost~]$ssh-keygen-trsa-P""Generatingpublic/privatersakeypair.Enterfileinwhichtosavethekey(/home/hduser/.ssh/id_rsa):Createddirectory'/home/hduser/.ssh'.Youridentificationhasbeensavedin/home/hduser/.ssh/id_rsa.Yourpublickeyhasbeensavedin/home/hduse

authorized_keys authorized section ssh linux hadoop fedora

hadoop - Hive QL - 在另一个表中使用键的子集行

我想用表B中出现的键对表A的所有行进行子集化。表A-IdnXY...12**13**14**表B-IdnABC...12***12***14***我想选择TableA中的所有元素，键出现在TableB中。以下SQL查询在Hive中不起作用-select*fromTableAwhereIdnin(selectdistinctIdnfromTableB)a;还有其他方法吗？可以在一个查询中完成吗？请注意，两个表的Idn都不需要是唯一的。最佳答案有点像SEMIJOIN应该这样做:SELECT*FROMTableALEFTSEMIJOI

hadoop Hive section code pre

hadoop - 找不到拆分类 org.apache.hadoop.hive.ql.io.orc.OrcSplit

我正在尝试使用orc作为hadoop流的输入格式我是这样运行的exportHADOOP_CLASSPATH=/opt/cloudera/parcels/CDH/lib/hive/lib/hive-exec.jarhadoopjar/opt/cloudera/parcels/CDH/lib/hadoop-mapreduce/hadoop-streaming.jar\-file/home/mr/mapper.py-mapper/home/mr/mapper.py\-file/home/mr/reducer.py-reducer/home/mr/reducer.py\-input/user/

hadoop OrcSplit apache cloudera hadoop-streaming

java - 包 org.apache.hadoop.hive.ql.exec.vector 不存在

我正在尝试使用HiveUDF和UDAF，到目前为止，我在VM上使用命令行中的maven已经很好地做到了这一点，该VM基本上是由知识渊博的人设置得很好。我是Java的新手(项目，与其说是语言)，但我至少可以看到我当前的问题是什么。我不知道它为什么会发生以及如何解决它。所以...我的问题是无论出于何种原因，在运行时mvninstall编译器找不到任何过去的类/org/apache/hadoop/hive/ql/exec它可以找到“exec”文件夹中的所有类，但在“exec”中嵌套的任何子文件夹中找不到任何类。我不明白为什么会这样。这是我的POM文件。org.apache.maven.plu

apache hadoop gt lt artifactId java maven

26 27 282930 31 32