Tables

mysql - 失败 : SemanticException Column line_id Found in more than One Tables/Subqueries

运行此配置单元脚本时出现以下错误。INSERTOVERWRITETABLEfoo_testPARTITION(ds='${DAY}')SELECTdt1.time,dt1.line_id,dt1.foo_id,dt1.bar_codeFROMtest_logsdt1JOIN(SELECTMIN(time)asfoo_time,line_id,foo_idFROMtest_logsWHERE(ds>='2015-02-10')ANDds='2015-02-10')ANDdt1.ds如何在没有错误的情况下运行此配置单元脚本？最佳答案

hadoop - 如何在两个指向同一个文件的EXTERNAL TABLES上在HIVE中创建UNION

我正在尝试编写一个Hive脚本来创建两个外部表，它们都指向具有不同正则表达式(过滤器)的同一文件位置。当我尝试在它们之间创建UNION时，结果与预期不符。第一段代码创建表CREATEEXTERNALTABLElogsFormat1(col1INT,col2STRING,col3INT)ROWFORMATSERDE'org.apache.hadoop.hive.serde2.RegexSerDe'WITHSERDEPROPERTIES("input.regex"="Regex1","output.format.string"="%1$s%2$s%3$s")STOREDASTEXTFILE

中创何在 section logsFormat 34 hadoop hive hiveql hadoop-partitioning

斯卡拉 Spark /鲨鱼 : How to access existing Hive tables in Hortonworks?

我正在尝试查找有关该主题的方法的一些文档/描述，请帮忙。我安装了Hortonworks的Hadoop2.2.0以及一些我需要查询的现有Hive表。HiveSQL在单个节点和集群上的运行速度极慢且不合理。我希望鲨鱼能更快地工作。从Spark/Shark文档中我无法弄清楚如何让Shark与现有的Hive表一起工作。任何想法如何实现这一目标？谢谢! 最佳答案您需要在特定于shark的配置单元目录中配置Metastore。在我回答的类似问题中提供了详细信息here.总而言之，您需要将hive-default.xml复制到hive-site

斯卡拉斯卡 gt lt property scala hadoop hive apache-spark shark-sql

hadoop - 错误配置单元(使用 Derby): Source tables cannot be empty

我刚开始使用Hive，遇到一个错误需要您的帮助。在等待一段时间后，当我尝试创建一个新数据库时，它发生了:hive>CREATEDATABASETest;(编辑:我对“SHOWTABLES”有同样的看法)我明白了:Exceptioninthread"main"java.lang.AssertionError:Sourcetablescannotbeemptyatorg.apache.hadoop.hive.ql.hooks.EnforceReadOnlyTables.(EnforceReadOnlyTables.java:46)atjava.lang.Class.forName0(Nat

配置单 hadoop gt lt property configuration hive derby

apache - Hbase 元数据错误 "tables no found"

我在hbase(hdfs)表中有一些数据，我将其复制到我的本地文件系统。然后在我的第二台机器上，我使用copyFromLocalhadoop命令将数据从本地复制到hdfs。现在，当我在hbase中(在第二台机器上)运行命令“list”时。显示没有表。我将表复制到hdfs中的一个目录中，该目录是hbase的数据目录，因此该表应该出现在hbase中。问题出在哪里？在两台机器上，hbase和hadoop的版本相同。如何将hbase表从一个集群复制到第二个集群？最佳答案已经有一些工具可用于管理此类任务(全部记录在此处:http://hb

amp apache hbase org hadoop hdfs

sql-server - Sqoop import-all-tables 命令的问题

我正在尝试使用Sqoop将多个SQLServer数据库中的所有表导入HDFS。我正在使用ClouderaCDH5.7。所以我输入以下命令:sqoopimport-all-tables--connect"jdbc:sqlserver://X.X.X.X:1433;database=FEPDB"--usernameXXXXX--passwordXXXXX--hive-import它运行成功，但“FEPDB”数据库中的所有表都没有被导入。我没有在HDFS的配置单元目录中找到它们，也没有在列出Hive中存在的所有表时找到它们。所以我尝试将所有表导入HDFS中的一个目录，然后创建hive表。我给

import-all-tables sql-server section import hadoop sqoop cloudera-cdh

hadoop - Spark : Not able to read data from hive tables

我已经创建了一个Maven项目作为pom.xml1.3.0org.apache.sparkspark-core_2.11${spark.version}org.scala-langscala-libraryorg.apache.sparkspark-sql_2.11${spark.version}mysqlmysql-connector-java5.1.6-->org.apache.sparkspark-hive_2.11${spark.version}我的类(class)正在从配置单元表中读取数据:importorg.apache.spark.sql.SQLContextimport

hadoop tables spark lt gt apache-spark hive metastore hivecontext

hadoop - Hive View 查询性能 : Union tables with different schemas

我有一个场景，我有两个Hive表，第二个表本质上是第一个表的演变模式(在此示例中它还有1个列)。Table_A{business_dateStringNameStringAgeNumber}partitionedbybusiness_dateTable_B{business_dateStringNameStringAgeNumberAddressString}partitionedbybusiness_date为了混淆下游用户对架构更改的影响，我使用以下语法创建一个HiveView:CreateVIEWcustomer_infoASselect*fromTable_BUNIONsele

different schemas business_date code business hadoop hive hiveql hive-query

database-design - Hadoop Hbase : Spreading column families across tables or not

Hbase的文档说的很清楚，相似的列应该归为列族，因为物理存储是由列族来完成的。但是将两个列族放在同一个表中，而不是每个列组都有单独的表，这意味着什么？是否存在以这种方式“分区”表更有意义的特定情况，以及一个“宽”表效果更好的情况？单独的表应该导致单独的“行区域”，这在一些列族(作为一个整体)非常稀疏时可能是有益的。相反，什么时候将列系列聚集在一起比较有利？最佳答案您已经了解了列族的概念:基本上，它只是提示HBase将这些项目存储和复制在一起以便更快地访问。如果您将两个列族放在同一个表中，并且总是有不同的键来访问它们，那么这实际

database-design Spreading section 的浏览量 hadoop hbase

php - 相当于 PHP PDO 中的 mysql_list_tables？

使用PHPPDO访问数据库时，有没有办法列出数据库中的所有表？需要像mysql_list_tables()这样的东西。最佳答案使用SQL查询做这样的事情怎么样:showtables或者，如果需要，指定数据库:showtablesfromcrawler而且，如果您只想获取一些表格:showtablesfromcrawlerlike'site%'实际上，即使mysql_list_tables()函数存在，其手册页状态:Thisfunctionisdeprecated.Itispreferabletousemysql_query()t

mysql_list_tables 相当 39 code length php pdo

15 16 171819 20 21