optimize-table

sql-server - Sqoop import-all-tables 命令的问题

我正在尝试使用Sqoop将多个SQLServer数据库中的所有表导入HDFS。我正在使用ClouderaCDH5.7。所以我输入以下命令:sqoopimport-all-tables--connect"jdbc:sqlserver://X.X.X.X:1433;database=FEPDB"--usernameXXXXX--passwordXXXXX--hive-import它运行成功，但“FEPDB”数据库中的所有表都没有被导入。我没有在HDFS的配置单元目录中找到它们，也没有在列出Hive中存在的所有表时找到它们。所以我尝试将所有表导入HDFS中的一个目录，然后创建hive表。我给

sql - 计算 SHOW TABLE EXTENDED 返回的结果集中的行

我需要检查给定的表是否已存在于Hadoop数据库中。为此，我使用Hive过程SHOWTABLEEXTENDEDINdb1LIKE'table1';它运行良好，如果表存在则返回多行。但在我的例子中，我必须计算结果集中的行数，或者在结果集为空的情况下返回零，否则返回1。我无法通过JDBC与数据库交互，因此我必须准确计算语句中的行数。最佳答案混合一些bash，hive-S-e'showtableextendedindatabaselike"tablename";'|grep'tableName'|wc-l如果不需要额外的信息，可以省略

EXTENDED TABLE code section 多行 sql hadoop hive resultset

hadoop - Spark : Not able to read data from hive tables

我已经创建了一个Maven项目作为pom.xml1.3.0org.apache.sparkspark-core_2.11${spark.version}org.scala-langscala-libraryorg.apache.sparkspark-sql_2.11${spark.version}mysqlmysql-connector-java5.1.6-->org.apache.sparkspark-hive_2.11${spark.version}我的类(class)正在从配置单元表中读取数据:importorg.apache.spark.sql.SQLContextimport

hadoop tables spark lt gt apache-spark hive metastore hivecontext

excel - 在 Mac 中使用 ODBC 连接从 Excel 查询 Hive 时出现 HortonWorks “Table or view not found”

我将Hortonworks沙箱2.1与ApacheHiveODBC驱动程序2.1和iODBC一起使用。当我使用iODBC软件测试时，ODBC连接成功。但是，当我打开excel并使用Microsoft查询将数据返回到excel电子表格时，我在运行SQLSELECTquery时遇到此错误:[Hortonworks][SQLEngine](31740)Tableorviewnotfound:HIVE.default.tweetsbi.我可以查看数据库中的表，但无法查看其中的内容。每当我按运行时，我都会收到上述错误。我在Excel2011和2016中遇到同样的错误

时出 HortonWorks code section strong excel hadoop hive odbc hortonworks-sandbox

hadoop - Apache hive : How to Add Column at Specific Location in Table

我想在Hive表的特定位置添加一个新列。当我添加新列时，它会转到最后一个位置。最佳答案您需要重新创建表。如果表是外部表并且数据已经包含新列，则发出drop和createtable语句。一般的解决方案是:1.createnew_table...;2.insertoverwritenew_tableselectfromold_table;3.dropold_table;4.alternew_tablerenametoold_table;此外，如果数据文件已经在某个位置包含新列，您可以1.Altertableaddcolumn使用此示

Specific Location section code table hadoop hive hiveql hiveddl

hadoop - hive.groupby.skewindata 是否依赖于 hive.optimize.skewjoin？

根据配置单元模板:hive.optimize.skewjoin:是否启用倾斜连接优化。算法如下:在运行时，检测具有较大偏斜的键。不处理这些key，而是将它们临时存储在HDFS目录中。在后续的map-reduce作业中，处理那些倾斜的键。不需要为所有表倾斜相同的键，因此，后续的map-reduce作业(对于倾斜的键)会快得多，因为它将是map-join。hive.groupby.skewindata:数据是否存在倾斜优化groupby查询但我不明白是否hive.groupby.skewindata是否依赖于hive.optimize.skewjoin？最佳答

hive skewindata section code hadoop bigdata hiveql

hadoop - Apache Sentry 引用中的 'limited to Hive table data' 是什么意思？

在这里https://www.cloudera.com/documentation/enterprise/5-9-x/topics/sentry_intro.html我们可以读到ApacheSentryOverviewApacheSentryisagranular,role-basedauthorizationmoduleforHadoop.SentryprovidestheabilitytocontrolandenforcepreciselevelsofprivilegesondataforauthenticatedusersandapplicationsonaHadoopclust

amp limited Sentry code section hadoop hive cloudera cloudera-cdh

hadoop - Hive managed table drop 不会删除 HDFS 上的文件。任何解决方案？

从hive中删除托管表时，它与hdfs中的关联文件不会被删除(在azure-databricks上)。我收到以下错误:[Simba]SparkJDBCDriverERRORprocessingquery/statement.ErrorCode:0,SQLstate:org.apache.spark.sql.AnalysisException:Cannotcreatethemanagedtable('`schema`.`XXXXX`').Theassociatedlocation('dbfs:/user/hive/warehouse/schema.db/XXXXX)alreadyexis

managed hadoop section schema stackoverflow hive hdfs azure-databricks

sql - 'pool_name' 在 CREATE TABLE 语句中意味着什么？

在CREATETABLE-statement末尾的Impala中您可以按照我的理解设置复制因子:CREATE[EXTERNAL]TABLE[IFNOTEXISTS][db_name.]table_name...[CACHEDIN'pool_name'[WITHREPLICATION=integer]|UNCACHED]无论如何，我有点不明白pool_name指的是什么。这是HDFS中存放数据的路径吗？最佳答案不完全是，它实际上是指使用hdfscacheadmin-addPool...命令定义的HDFS池，参见hdfscomman

amp pool_name section pool the sql hadoop hdfs impala

hadoop - Hive alter table 语句

ALTERTABLEabcADDPARTITION(year= 2014,month=1,day=1)location'/data/input/abc/year=2014/month=1/day=1';FAILED:ParseExceptionline1:47character' 'notsupportedhere为什么会出现这个错误最佳答案出现错误是因为您的分区命令中有空格。year=2014试试看year=2014...假设您的年份列是int。类型。如果它是你需要的字符串year='2014'

hadoop alter section code pre hive