jobtitle_select

hadoop - Impala 可以从表中执行 COUNT() 但不能执行 SELECT

我遇到了一个奇怪的Impala行为。我从复制到Hadoop集群中的.csv文件在HUE中创建了一个表。我可以通过Metastore管理器在HUE中正确导航表格，但我无法在Impala中运行以下查询，因为它会抛出IllegalStateException:null异常:select*frommy_db.my_tablelimit100;奇怪的是下面的命令检索到正确的行数:selectcount(*)frommy_db.my_table; 最佳答案错误是由无效类型引起的。并不是所有的Hive数据类型在Impala中都受支持。Impal

hadoop - HIVE:CREATE TABLE AS SELECT 命令无法指定目标表的列列表

我怎样才能让它工作？hive>desctemp;OKaintbintTimetaken:0.077seconds,Fetched:2row(s)我想创建列名为c和d的t2HIVE表，但出现以下错误。hive>createtablet2(cint,dint)asselecta,bfromtemp;FAILED:SemanticException[Error10065]:CREATETABLEASSELECTcommandcannotspecifythelistofcolumnsforthetargettable 最佳答案您无需再次提

列列 hadoop section code pre hive

scala - Spark 标度 : select column name from other dataframe

有两个json，第一个json有更多的列，并且总是超集。valdf1=spark.read.json(sqoopJson)valdf2=spark.read.json(kafkaJson)除了操作:我喜欢在df1和df2上应用except操作，但是df1有10列，而df2只有8列。如果手动从df1中删除2列，则except将起作用。但是我有50多个表/json，需要对所有50组表/json执行EXCEPT。问题:如何从DF1中仅选择DF2(8)列中可用的列并创建新的df3？所以df3将拥有来自df1的有限列的数据，并且它将与df2列匹配。最佳答案

dataframe column section strong df scala apache-spark hadoop apache-spark-sql

hadoop - 如何让 HIVE 中的 CREATE TABLE...AS SELECT 不填充数据？

当我在HIVE中运行CTAS时，数据也会同时填充。但我只想创建表，而不是填充数据。我应该怎么做？谢谢。最佳答案您可以使用LIKE关键字来做到这一点。createtablenew_table_nameLIKEold_table_name这将创建没有数据的表结构。关于hadoop-如何让HIVE中的CREATETABLE...ASSELECT不填充数据？，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.co

充数 hadoop section strong 中运 hive hiveql

hadoop - 如何使用 INSERT-SELECT 查询加载具有复杂数据类型的 Hive 表

我们有一个查询，用于将数据加载到一个表中，使用INSERT-SELECT查询直接在另一个表上，如下所示INSERTOVERWRITETABLESELECT*FROMt2WHERE;同样如何加载复杂数据类型的表？我怎样才能让我的SELECT查询中的几个/一些列为复杂数据类型的列做出贡献？我清楚了吗？table1的模式是TABLE(col1INT,col2STRING,col3ARRAY)注意:从文件加载到这样的表是可能的，但我只是想尝试是否可以使用上面的INSERT-SELECT查询方式加载。感谢您的关注。最佳答案 Hive等同于i

INSERT-SELECT hadoop table code section hive hiveql

java - 如何在 Hive 嵌入式模式下运行包含 "select count(*)"和 "group by"子句的 Hive Sql 查询？

如何在Hive嵌入式模式下运行此查询(1)selectproduct,count(*)ascntfromhive_bigpetstore_etlgroupbyproduct在Maven控制台中，我得到一个InvocationTargetException异常在我找到的Hive日志文件中java.lang.Exception:java.lang.NullPointerExceptionatorg.apache.hadoop.mapred.LocalJobRunner$Job.run(LocalJobRunner.java:354)Causedby:java.lang.NullPointe

amp Hive java code hadoop sql

RLive : Only simple `select` works?

我在CentOS(Linux2.6.32-431.5.1.el6.x86_64)上使用Hadoop2.2.0.2.0.6.0-101运行RHive(https://github.com/nexr/RHive)RHive可以进行基本的select查询:rhive.query("select*fromsimple")并且RHive无法执行带条件的查询。例如:rhive.query("select*fromsimpleorderbyrating")Error:java.sql.SQLException:Errorwhileprocessingstatement:FAILED:Executio

simple select section code blockquote r hadoop

hadoop - Hive:对于通过 HiveServer2 具有超过 5000 行的表，select * from table 失败

我在Hive中有一个表sdh，它有100000行。当我执行命令时select*fromsdh在CLI上，显示所有行但是当我在直线上通过HiveServer2运行它时，相同的命令只是挂起所有其他具有1000奇数行的表都可以通过CLI或直线运行。还有其他人遇到过类似的问题吗？我从日志中得到错误org.apache.thrift.TApplicationException:InternalerrorprocessingFetchResultsatorg.apache.thrift.TApplicationException.read(TApplicationException.java:10

HiveServer2 HiveServer apache java BeeLine hadoop hive

hadoop - 在配置单元查询的 SELECT 部分重用别名

我想在配置单元查询的SELECT部分中重复使用别名。我的用例是重用case语句的结果，但我相信这个例子就足够了:createtabletestmeasselectaccountidasabc,abcasxyzfromaccount_attributes;Hive提示找不到“abc”。有任何建议的解决方法吗？最佳答案试试这个:createtabletestmeasselectaccountidasabc,accountidasxyzfromaccount_attributes; 关于h

配置单重用 section code hadoop hive hdfs

scala - 从spark中的json模式动态生成df.select语句

我正在从宽字符串中选择列，其偏移量如下所示df2=df.select(substring(col("a"),4,6).as("c")).cast(IntegerType)但是我必须从字符串中提取1000列，如果我可以提供诸如列名、数据类型、宽度、起始位置和结束位置等详细信息，那么如何使用jsonsparkstruct模式生成select语句。另外，我不得不将一些列转换为intergertype或longtype，但是我观察到这些字段被像111111111将在转换为integertype时转换为1 最佳答案如果可以使用configf

select scala section 列名 apache-spark hadoop bigdata