草庐IT

lock-tables

全部标签

mysql - 失败 : SemanticException Column line_id Found in more than One Tables/Subqueries

运行此配置单元脚本时出现以下错误。INSERTOVERWRITETABLEfoo_testPARTITION(ds='${DAY}')SELECTdt1.time,dt1.line_id,dt1.foo_id,dt1.bar_codeFROMtest_logsdt1JOIN(SELECTMIN(time)asfoo_time,line_id,foo_idFROMtest_logsWHERE(ds>='2015-02-10')ANDds='2015-02-10')ANDdt1.ds如何在没有错误的情况下运行此配置单元脚本? 最佳答案

hadoop - 如何在两个指向同一个文件的EXTERNAL TABLES上在HIVE中创建UNION

我正在尝试编写一个Hive脚本来创建两个外部表,它们都指向具有不同正则表达式(过滤器)的同一文件位置。当我尝试在它们之间创建UNION时,结果与预期不符。第一段代码创建表CREATEEXTERNALTABLElogsFormat1(col1INT,col2STRING,col3INT)ROWFORMATSERDE'org.apache.hadoop.hive.serde2.RegexSerDe'WITHSERDEPROPERTIES("input.regex"="Regex1","output.format.string"="%1$s%2$s%3$s")STOREDASTEXTFILE

hadoop - Apache 麒麟 : Intermediate table not found

我是麒麟的新手。安装后,我运行sample.sh,然后构建立方体,但得到错误消息:java.io.IOException:NoSuchObjectException(message:default.kylin_intermediate_kylin_sales_cube_desc_19700101000000_20160101000000_38b1539f_1f69_406d_89ed_96f3ca776841tablenotfound)atorg.apache.hive.hcatalog.mapreduce.HCatInputFormat.setInput(HCatInputForma

hadoop - 如何在 S3 上指定 Hive EXTERNAL TABLE 数据的文件大小

我可以在Hive中创建一个EXTERNALTABLE,其中数据以Gzip格式存储在S3存储桶中。但是,这些文件非常大(每个超过6GB)。能否配置Hive使EXTERNALTABLE中的文件具有特定大小,比如512MB? 最佳答案 这对我来说听起来很奇怪,默认情况下,我的外部表通常有大约300MB的文件大小。无论如何,最简单的调整方法是使用PARTITIONBY键(可能是基于时间戳的东西),这将强制文件变小,并且具有使数据更容易的附加优势查询。此外,您应该考虑使用像Parquet这样的可拆分格式,因为这样文件大小就不再重要了。

hadoop - 配置单元 hadoop : selecting data from table getting error

我在Hive中创建了一个外部表后,我想知道推文的数量,所以我写了下面的查询,但是我得到了这个错误,请问如何解决这个问题,这是mapred-site.xml的配置mapred.job.trackerlocalhost:8021hive>selectcount(*)fromtweet;TotalMapReducejobs=1LaunchingJob1outof1Numberofreducetasksdeterminedatcompiletime:1Inordertochangetheaverageloadforareducer(inbytes):sethive.exec.reducers.

hadoop - 如何在 hive create table "TBLPROPERTIES"中引用 HBase 命名空间

我正在尝试使用HBase表('test_table)作为源创建Hive外部表。HBase表是在HBase命名空间“test_namespace”下创建的。在应用程序的其他部分,我使用以下语法访问表test_namespace:test_table或hbase://test_namespace:test_table按照同样的方法我创建了一个配置单元脚本CREATEEXTERNALTABLEIFNOTEXISTSTEST_INDIVIDUAL(keystring,teststring,photostring,locationstring)STOREDBY'org.apache.hadoop

sql - 如何正确格式化 "select top 1000 * from schema.table_name;"以在 Toad 4 Apache Hadoop 中工作?

尝试在Toad4ApacheHadoop(Hive)中运行它,它无法识别top函数。我该如何重新格式化?selecttop1000*fromFinance.ACCT_LIST 最佳答案 您可以使用LIMIT:select*fromFinance.ACCT_LISTorderbysomecolumnlimit1000如果你想得到一组一致的行,你应该添加一个orderby子句。 关于sql-如何正确格式化"selecttop1000*fromschema.table_name;"以在Toad

hadoop - Sqoop如何导入表table1, table2, table3?

一位雇主问如何在单数据库和多数据库中导入表1和表2、表3? 最佳答案 你可以试试:多个表:尝试使用“import-all-tables”和逗号分隔的“exclude-tables”选项:sqoopimport-all-tables--connectjdbc:mysql://localhost/sqoop--usernameroot--passwordhadoop--target-dir'/sqoop'--exclude-tablestable1,table2多表:在Sqoop1.99中有一个用于执行自定义SQL查询的选项-您可以检查

hadoop - SAP 沃拉 : Not able to add Vora table as Virtual table via Smart Data Access in HANA Studio

我正在使用带有HANAExpress2SP01的虚拟机。在一个小型测试集群上,我安装了HortonworksDataPlatform2.6和Spark1.6.3,还添加了HANAVora1.4和SparkController2.1。我遵循了SAPVora安装和管理指南:https://help.sap.com/http.svc/rc/f09ec811fe634f588647c342cac84c38/1.4/en-US/SAP_Vora_Installation_Admin_Guide_1.4_en.pdf直到第2.9章。一切正常,但Zeppelin部分与%jdbc解释器:%jdbcse

hadoop - 当我们 select * table_name where id = 10; 时运行了多少映射器和缩减器;在 hive

当我们select*table_namewhereid=10;时运行了多少映射器和缩减器;在hive?它是基于输入分割还是文件大小?在这种情况下如何确定映射器和缩减器的数量?有什么建议吗? 最佳答案 对于输入表的每个输入拆分,将调度一个映射器,其中输入拆分的默认大小将是block大小。您可以通过修改mapreduce.input.fileinputformat.split.maxsize来改变映射器的数量和mapreduce.input.fileinputformat.split.minsize属性。谈到Hive中的reducer数