草庐IT

columns-table

全部标签

apache - Hbase 元数据错误 "tables no found"

我在hbase(hdfs)表中有一些数据,我将其复制到我的本地文件系统。然后在我的第二台机器上,我使用copyFromLocalhadoop命令将数据从本地复制到hdfs。现在,当我在hbase中(在第二台机器上)运行命令“list”时。显示没有表。我将表复制到hdfs中的一个目录中,该目录是hbase的数据目录,因此该表应该出现在hbase中。问题出在哪里?在两台机器上,hbase和hadoop的版本相同。如何将hbase表从一个集群复制到第二个集群? 最佳答案 已经有一些工具可用于管理此类任务(全部记录在此处:http://hb

mysql - 插入导致异常 ParseException 行 1 :12 missing TABLE at 'table_name' near '<EOF>' 的 Select 命令

我刚接触hadoop和hive2天。所以,我的理解是非常基础的。我有一个可能很愚蠢的问题。问题:我有一个配置单元外部表ABC,并创建了一个类似于ABC_TEST表的示例测试表。我的目标是根据select子句将ABC的某些内容复制到ABC_TEST。所以我使用以下命令创建了ABC_TEST:CREATETABLEABC_TESTLIKEABC;问题是:1)此ABC_TEST不是外部表。2)使用Desc命令,ABC_TEST的LOCATION内容类似于hdfs://somepath/somdbname.db/ABC_TEST-->Oncommand"hadoopfs-lshdfs://so

hadoop - 谷歌大查询 : Incompatible table partitioning specification

从未分区的临时表向按天分区的最终表提交复制作业时,我收到了cause:java.io.IOException:ErrorMessage:Incompatibletablepartitioningspecification.Expectspartitioningspecificationinterval(type:day),butinputpartitioningspecificationisnone;那么复制作业到分区表的输入表是否有任何限制,如何克服这些限制?使用Load作业在hadoopbigquery-connector类中创建临时表。而JobConfigurationLoad根

sql-server - Sqoop import-all-tables 命令的问题

我正在尝试使用Sqoop将多个SQLServer数据库中的所有表导入HDFS。我正在使用ClouderaCDH5.7。所以我输入以下命令:sqoopimport-all-tables--connect"jdbc:sqlserver://X.X.X.X:1433;database=FEPDB"--usernameXXXXX--passwordXXXXX--hive-import它运行成功,但“FEPDB”数据库中的所有表都没有被导入。我没有在HDFS的配置单元目录中找到它们,也没有在列出Hive中存在的所有表时找到它们。所以我尝试将所有表导入HDFS中的一个目录,然后创建hive表。我给

hadoop - 改变(EMPTY)表添加分区COLUMN

HDP-2.5.0.0使用Ambari2.4.0.1有几个SQLServer和Oracle数据库模式需要导入到HDFS/Hive。当前的方法运行良好:Sqoop以avro格式从RDBMS导入HDFS在avro文件之上创建一个Hive外部表,即。dataaggregate_avro_compressed根据步骤2创建最终表。将此步骤自动化将第2步中表中的数据插入到最终表中现在,第3步。表必须是ORC+COMPRESSED+PARTITIONED并且可能是MANAGED。手动,可以完成以下操作:CREATETABLE`dataaggregate_orc_empty`(......)PART

sql - 计算 SHOW TABLE EXTENDED 返回的结果集中的行

我需要检查给定的表是否已存在于Hadoop数据库中。为此,我使用Hive过程SHOWTABLEEXTENDEDINdb1LIKE'table1';它运行良好,如果表存在则返回多行。但在我的例子中,我必须计算结果集中的行数,或者在结果集为空的情况下返回零,否则返回1。我无法通过JDBC与数据库交互,因此我必须准确计算语句中的行数。 最佳答案 混合一些bash,hive-S-e'showtableextendedindatabaselike"tablename";'|grep'tableName'|wc-l如果不需要额外的信息,可以省略

hadoop - Spark : Not able to read data from hive tables

我已经创建了一个Maven项目作为pom.xml1.3.0org.apache.sparkspark-core_2.11${spark.version}org.scala-langscala-libraryorg.apache.sparkspark-sql_2.11${spark.version}mysqlmysql-connector-java5.1.6-->org.apache.sparkspark-hive_2.11${spark.version}我的类(class)正在从配置单元表中读取数据:importorg.apache.spark.sql.SQLContextimport

hadoop - 配置单元 : group column based on max value

我有一个包含字段的表datevalue10-02-19002309-05-19012210-03-19001010-02-190124....我必须返回每年的最大值即,190023190124我尝试了以下查询,但得到了错误的答案。SELECTYEAR(FROM_UNIXTIME(UNIX_TIMESTAMP(date,'dd-mm-yyyy')))asdate,MAX(value)FROMtebGROUPBYdate;有人可以建议我查询吗? 最佳答案 选项1selectyear(from_unixtime(unix_timestam

hadoop - 如何将 Sqoop 导入命令与 --map-column-hive 一起使用?

我正在尝试将Teradata中的数据Sqoop到配置单元。我想到了以下步骤:1)在Hue中创建一个包含所有必填字段的Hive表。2)通过使用Sqoopimport命令和--map-column-hive属性将数据从Teradata加载到hive。Sqoopimport命令如何指向已经创建的Hive表,以便将Sqooped数据放到对应的Hive表中? 最佳答案 您可以使用shell和awk从现有表生成map-column-hive属性。它将以COL1=TYPE,COL2=TYPE,...COLN=TYPE的形式生成#!/bin/bas

excel - 在 Mac 中使用 ODBC 连接从 Excel 查询 Hive 时出现 HortonWorks “Table or view not found”

我将Hortonworks沙箱2.1与ApacheHiveODBC驱动程序2.1和iODBC一起使用。当我使用iODBC软件测试时,ODBC连接成功。但是,当我打开excel并使用Microsoft查询将数据返回到excel电子表格时,我在运行SQLSELECTquery时遇到此错误:[Hortonworks][SQLEngine](31740)Tableorviewnotfound:HIVE.default.tweetsbi.我可以查看数据库中的表,但无法查看其中的内容。每当我按运行时,我都会收到上述错误。我在Excel2011和2016中遇到同样的错误