元

hadoop - 如何在配置单元中获得毫秒精度？

documentation表示时间戳支持以下转换:•float字类型:解释为以秒为单位的UNIX时间戳，精度为小数首先，我不确定如何解释这一点。如果我有时间戳2013-01-0112:00:00.423，我可以将其转换为保留毫秒的数字类型吗？因为这就是我想要的。更一般地说，我需要在时间戳之间进行比较，例如selectmaxts-mintsaslatencyfrommytable其中maxts和mints是时间戳列。目前，这给了我NullPointerException使用Hive0.11.0。如果我做类似的事情，我就可以执行查询selectunix_timestamp(maxts)-u

配置单何在 code section timestamp hadoop hive hiveql

hadoop - 嵌入式模式下的 Spark - 未找到用户/配置单元/仓库

我在嵌入式本地模式下使用ApacheSpark。我的pom.xml和同一版本(spark-core_2.10、spark-sql_2.10和spark-hive_2.10)中包含所有依赖项。我只想运行一个HiveQL查询来创建一个表(存储为Parquet)。运行以下(相当简单的)代码:publicclassApp{publicstaticvoidmain(String[]args)throwsIOException,ClassNotFoundException{SparkConfsparkConf=newSparkConf().setAppName("JavaSparkSQL").se

配置单 hadoop code hive section apache-spark apache-spark-sql parquet

sql - 配置单元中 `load data inpath ` 和 `location` 之间的区别？

在我的公司，我经常看到这两个命令，我想知道它们之间的区别，因为它们的功能对我来说似乎是一样的:1createtable(namestring,numberdouble);loaddatainpath'/directory-path/file.csv'into;2createtable(namestring,numberdouble);location'/directory-path/file.csv';它们都将数据从HDFS上的目录复制到HIVE上的表目录中。使用这些时是否应该注意差异？谢谢你。最佳答案是的，它们的用途完全不同。

配置单 location strong section code sql hadoop hive hdfs hiveql

hadoop - 如何在配置单元查询中编写 case 和 group by

这是我的hive表:coursedeptsubjectstatusbtechcsejavapassbtechcsehadoopfailbtechcsecgdetainedbtechcseccpassbtechitdaapassbtechitwtpassbtechitcnnpassmbahrhrlawpassmbahrhrguidabsentmtechcsjavapassmtechcscdpassmtechcscpdetained我想通过以下方式查询此表以检索数据:coursedeptstatusbtechcsefailbtechitpassmbahrabsentmtechcsfail首

配置单何在 code status 39 hadoop hive hiveql

scala - 从配置单元表中读取并使用 spark sql 写回它

我正在使用SparkSQL读取Hive表并将其分配给scalavalvalx=sqlContext.sql("select*fromsome_table")然后我对数据框x进行一些处理，最后得到一个数据框y，它具有与表some_table完全相同的模式。最后，我试图将y数据框插入到同一个配置单元表some_table中y.write.mode(SaveMode.Overwrite).saveAsTable().insertInto("some_table")然后我得到错误org.apache.spark.sql.AnalysisException:Cannotinsertoverwri

配置单 scala table 34 section apache-spark hadoop apache-spark-sql

json - 在配置单元脚本中使用 json_tuple 语法时发生错误

我已将配置单元版本从0.20更新到0.13.1。我正在使用下表和查询从S3中提取json。表:>CREATEEXTERNALTABLEin_app_logs(>eventstring,>app_idstring,>idfastring,>idfvstring>)ROWFORMATDELIMITED>FIELDSTERMINATEDBY'\t'>LOCATION's3://test/in_app_logs/ds=2015-04-20/';我的查询看起来像下面的版本0.20，它在旧版本上运行良好。SELECTget_json_object(in_app_logs.event,'$.ev')

配置单 json 34 event in_app_logs hadoop amazon-s3 hive

hadoop - 如何从具有特定分区的配置单元中选择数据？

大家。以下是与配置单元的交互:hive>showpartitionsTABLENAMEpt=2012.07.28.08/is_complete=1pt=2012.07.28.09/is_complete=1pt=2012.07.28.10/is_complete=1pt=2012.07.28.11/is_complete=1hive>select*fromTABLENAMEwherept='2012.07.28.10/is_complete=1'limit1;OKTimetaken:2.807secondshive>select*fromTABLENAMEwherept='2012.0

配置单中选 is_complete section complete hadoop hive

hadoop - 如何在特定日期之前使用配置单元添加分区？

我正在使用配置单元(带有外部表)来处理存储在amazonS3上的数据。我的数据分区如下:DIRs3://test.com/2014-03-01/DIRs3://test.com/2014-03-02/DIRs3://test.com/2014-03-03/DIRs3://test.com/2014-03-04/DIRs3://test.com/2014-03-05/s3://test.com/2014-03-05/ip-foo-request-2014-03-05_04-20_00-49.logs3://test.com/2014-03-05/ip-foo-request-2014-0

配置单何在 test 2014 com hadoop amazon-s3 hive

hadoop - 显示配置单元 View 的 SQL 定义

如何以SQL形式显示配置单元View的View定义。大多数关系数据库都支持这样的命令SHOWCREATEVIEWviewname; 最佳答案使用显示创建表。阅读hivemanual了解更多详情。关于hadoop-显示配置单元View的SQL定义，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questions/24579820/

配置单 hadoop section code hive

hadoop - 将数据从平面文件加载到配置单元表时获取空值

我在将数据从平面文件加载到配置单元表时得到空值。我的表结构是这样的:hive>createtabletest_hive(idint,valuestring);我的平面文件是这样的:输入.txt1a2b3c4d5e6F7G8j当我运行以下命令时，我得到的是空值:hive>LOADDATALOCALINPATH'/home/hduser/input.txt'OVERWRITEINTOTABLEtest_hive;hive>select*fromtest_hive;OKNULLNULLNULLNULLNULLNULLNULLNULLNULLNULLNULLNULLNULLNULLNULLNU

配置单 hadoop NULL hive test_hive hdfs flat-file

63 64 656667 68 69