import-table_草庐IT

sql - 'pool_name' 在 CREATE TABLE 语句中意味着什么？

在CREATETABLE-statement末尾的Impala中您可以按照我的理解设置复制因子:CREATE[EXTERNAL]TABLE[IFNOTEXISTS][db_name.]table_name...[CACHEDIN'pool_name'[WITHREPLICATION=integer]|UNCACHED]无论如何，我有点不明白pool_name指的是什么。这是HDFS中存放数据的路径吗？最佳答案不完全是，它实际上是指使用hdfscacheadmin-addPool...命令定义的HDFS池，参见hdfscomman

hadoop - Hive alter table 语句

ALTERTABLEabcADDPARTITION(year= 2014,month=1,day=1)location'/data/input/abc/year=2014/month=1/day=1';FAILED:ParseExceptionline1:47character' 'notsupportedhere为什么会出现这个错误最佳答案出现错误是因为您的分区命令中有空格。year=2014试试看year=2014...假设您的年份列是int。类型。如果它是你需要的字符串year='2014'

hadoop alter section code pre hive

hadoop - 集成 Hbase 和 Hive : Register Hbase table

我正在使用包含以下版本的Hbase和Hive的HortonworksSandbox2.0ComponentVersion------------------------ApacheHadoop2.2.0ApacheHive0.12.0ApacheHBase0.96.0ApacheZooKeeper3.4.5...和我正在尝试使用以下查询将我的hbase表注册到配置单元中CREATETABLEIFNOTEXISTSDocument_Table_Hive(keySTRING,authorSTRING,categorySTRING)STOREDBY‘org.apache.hadoop.hiv

Hbase Register hadoop code hive apache-zookeeper hortonworks-data-platform

hadoop - Hive - 静态分区 - 直接创建分区目录与使用 alter table 语句的区别

下面两个在hive中创建静态分区的语句之间是否存在任何内部/性能差异，我已经尝试了两种方法并且在将数据加载到分区后它们都可以正常工作dfs-mkdir/user/cloudera/sqoop_import/avroData/orders_part/order_month=2014-02;altertableorders_partaddpartition(order_month='2014-02'); 最佳答案此命令:dfs-mkdir/user/cloudera/sqoop_import/avroData/orders_part/

hadoop alter code orders_part order_month hive hdfs hive-partitions hiveddl

hadoop - Apache Sqoop Where 子句在使用 SQOOP IMPORT 时不起作用

谁能告诉我这个命令的输出是什么:这里的departments表有默认的6行(从dept_id2到7)，然后我向Mysqldb'retail_db.departments'表(department_id8和9)添加了2条新记录。我想做的是通过使用–where参数并将其附加(–append)到部门的现有HDFS目录来仅选择新添加的记录。因此，当我运行以下命令时，它创建了一个新的part-m-000006文件(之前默认的6条记录被拆分为part-m-00000到part-m-00005文件)和department_id2到9的所有记录(这includes2newlyaddedrecs)被添加

hadoop Apache INFO 23 code sqoop

hadoop - Hive 'alter table <table name> concatenate' 是如何工作的？

我有n(large)个小型orc文件，我想将它们合并到k(small)个大型orc文件中。这是在Hive中使用altertabletable_nameconcatenate命令完成的。我想了解Hive是如何实现的。如果需要，我希望使用Spark进行任何更改来实现这一点。任何指针都会很棒。最佳答案根据AlterTable/PartitionConcatenate:如果表或分区包含很多小的RCFiles或ORC文件，那么上面的命令会将它们合并成更大的文件。在RCFile的情况下，合并发生在block级别，而对于ORC文件，合并发生在

amp table section code noreferrer hadoop hive hiveql orc

hadoop - 为什么在执行 "/shared"时未列出 `hadoop fs -ls` 目录，尽管在执行 `hadoop fs -ls/shared/table_name` 时它是可见的

当我执行-ls命令时，未列出/shared目录[cts573151@aster2~]$hadoopfs-lsdrwx-------cts573151supergroup02016-12-2105:30.Trashdrwxr-xr-x-cts573151supergroup02017-02-0112:28.sparkStagingdrwx-------cts573151supergroup02017-02-0211:37.stagingdrwxr-xr-x-cts573151supergroup02016-12-1911:40_sqoopdrwxr-xr-x-cts573151super

hadoop shared supergroup code drwxr-xr-x hdfs

hadoop - 与 sqoop-import 相关的查询？

场景:我已将数据从SQlServer导入到HDFS。HDFS目录中的数据存储在多个文件中为:part-m-00000part-m-00001part-m-00002part-m-00003问题:我的问题是，在从HDFS目录读取存储的数据时，我们必须读取所有文件(part-m-00000,01,02,03)或仅读取part-m-00000。因为当我读取那个数据的时候，我发现HDFS里面的数据有点少了。那么，是它发生了还是我错过了什么？最佳答案您需要读取所有文件，而不仅仅是00000。存在多个文件的原因是sqoop以map-redu

sqoop-import hadoop section part-m part sqoop

import - HBase 导出/导入 : Unable to find output directory

我正在为我的应用程序使用HBase，我正在尝试使用org.apache.hadoop.hbase.mapreduce.Export导出数据，因为它是指示here.我面临的问题是，一旦执行了命令，创建导出时就没有错误。但是指定的输出目录并没有出现在它的位置。我使用的命令是$bin/hbaseorg.apache.hadoop.hbase.mapreduce.Exporttable_namedb_dump/ 最佳答案我得到了解决方案，因此我正在回复我自己的答案hadoop的conf目录下的hadoop-env.sh必须有如下两行exp

directory import hbase hadoop code export

oracle - Sqoop 导入失败 : Cannot convert SQL type 2005 when trying to import Oracle table

尝试将Oracle数据库中的表作为parquet文件导入时出现以下错误。ERRORtool.ImportTool:ImportedFailed:CannotconvertSQLtype2005这个问题已经有人提出了here，但建议的解决方案对我没有帮助。我正在尝试使用以下命令从命令行导入一个表，中的参数用相应的值填充:sqoopimport--connectjdbc:oracle:thin:@:/--username--password--hive-import--query'SELECT*FROM.WHERE$CONDITIONS'--split-by--hive-database-

convert oracle code section gt hadoop sqoop