草庐IT

jobtitle_select

全部标签

hadoop - Impala 可以从表中执行 COUNT(*) 但不能执行 SELECT *

我遇到了一个奇怪的Impala行为。我从复制到Hadoop集群中的.csv文件在HUE中创建了一个表。我可以通过Metastore管理器在HUE中正确导航表格,但我无法在Impala中运行以下查询,因为它会抛出IllegalStateException:null异常:select*frommy_db.my_tablelimit100;奇怪的是下面的命令检索到正确的行数:selectcount(*)frommy_db.my_table; 最佳答案 错误是由无效类型引起的。并不是所有的Hive数据类型在Impala中都受支持。Impal

hadoop - HIVE:CREATE TABLE AS SELECT 命令无法指定目标表的列列表

我怎样才能让它工作?hive>desctemp;OKaintbintTimetaken:0.077seconds,Fetched:2row(s)我想创建列名为c和d的t2HIVE表,但出现以下错误。hive>createtablet2(cint,dint)asselecta,bfromtemp;FAILED:SemanticException[Error10065]:CREATETABLEASSELECTcommandcannotspecifythelistofcolumnsforthetargettable 最佳答案 您无需再次提

scala - Spark 标度 : select column name from other dataframe

有两个json,第一个json有更多的列,并且总是超集。valdf1=spark.read.json(sqoopJson)valdf2=spark.read.json(kafkaJson)除了操作:我喜欢在df1和df2上应用except操作,但是df1有10列,而df2只有8列。如果手动从df1中删除2列,则except将起作用。但是我有50多个表/json,需要对所有50组表/json执行EXCEPT。问题:如何从DF1中仅选择DF2(8)列中可用的列并创建新的df3?所以df3将拥有来自df1的有限列的数据,并且它将与df2列匹配。 最佳答案

hadoop - 如何让 HIVE 中的 CREATE TABLE...AS SELECT 不填充数据?

当我在HIVE中运行CTAS时,数据也会同时填充。但我只想创建表,而不是填充数据。我应该怎么做?谢谢。 最佳答案 您可以使用LIKE关键字来做到这一点。createtablenew_table_nameLIKEold_table_name这将创建没有数据的表结构。 关于hadoop-如何让HIVE中的CREATETABLE...ASSELECT不填充数据?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.co

hadoop - 如何使用 INSERT-SELECT 查询加载具有复杂数据类型的 Hive 表

我们有一个查询,用于将数据加载到一个表中,使用INSERT-SELECT查询直接在另一个表上,如下所示INSERTOVERWRITETABLESELECT*FROMt2WHERE;同样如何加载复杂数据类型的表?我怎样才能让我的SELECT查询中的几个/一些列为复杂数据类型的列做出贡献?我清楚了吗?table1的模式是TABLE(col1INT,col2STRING,col3ARRAY)注意:从文件加载到这样的表是可能的,但我只是想尝试是否可以使用上面的INSERT-SELECT查询方式加载。感谢您的关注。 最佳答案 Hive等同于i

java - 如何在 Hive 嵌入式模式下运行包含 "select count(*)"和 "group by"子句的 Hive Sql 查询?

如何在Hive嵌入式模式下运行此查询(1)selectproduct,count(*)ascntfromhive_bigpetstore_etlgroupbyproduct在Maven控制台中,我得到一个InvocationTargetException异常在我找到的Hive日志文件中java.lang.Exception:java.lang.NullPointerExceptionatorg.apache.hadoop.mapred.LocalJobRunner$Job.run(LocalJobRunner.java:354)Causedby:java.lang.NullPointe

RLive : Only simple `select` works?

我在CentOS(Linux2.6.32-431.5.1.el6.x86_64)上使用Hadoop2.2.0.2.0.6.0-101运行RHive(https://github.com/nexr/RHive)RHive可以进行基本的select查询:rhive.query("select*fromsimple")并且RHive无法执行带条件的查询。例如:rhive.query("select*fromsimpleorderbyrating")Error:java.sql.SQLException:Errorwhileprocessingstatement:FAILED:Executio

hadoop - Hive:对于通过 HiveServer2 具有超过 5000 行的表,select * from table 失败

我在Hive中有一个表sdh,它有100000行。当我执行命令时select*fromsdh在CLI上,显示所有行但是当我在直线上通过HiveServer2运行它时,相同的命令只是挂起所有其他具有1000奇数行的表都可以通过CLI或直线运行。还有其他人遇到过类似的问题吗?我从日志中得到错误org.apache.thrift.TApplicationException:InternalerrorprocessingFetchResultsatorg.apache.thrift.TApplicationException.read(TApplicationException.java:10

hadoop - 在配置单元查询的 SELECT 部分重用别名

我想在配置单元查询的SELECT部分中重复使用别名。我的用例是重用case语句的结果,但我相信这个例子就足够了:createtabletestmeasselectaccountidasabc,abcasxyzfromaccount_attributes;Hive提示找不到“abc”。有任何建议的解决方法吗? 最佳答案 试试这个:createtabletestmeasselectaccountidasabc,accountidasxyzfromaccount_attributes; 关于h

scala - 从spark中的json模式动态生成df.select语句

我正在从宽字符串中选择列,其偏移量如下所示df2=df.select(substring(col("a"),4,6).as("c")).cast(IntegerType)但是我必须从字符串中提取1000列,如果我可以提供诸如列名、数据类型、宽度、起始位置和结束位置等详细信息,那么如何使用jsonsparkstruct模式生成select语句。另外,我不得不将一些列转换为intergertype或longtype,但是我观察到这些字段被像111111111将在转换为integertype时转换为1 最佳答案 如果可以使用configf