HIVE_草庐IT

hadoop - 如何将多个表的结果写入配置单元中的单个表？

我想通过从多个表中选择列来将结果写入单个表。我想在hive中实现类似下面的目标。SELECTTable0.num,Table1.field1,Table2.field2,Table3.field3,Table4.field4FROMTable0FULLOUTERJOINTable1ONTable0.num=Table1.numFULLOUTERJOINTable2ONTable0.num=Table2.numFULLOUTERJOINTable3ONTable0.num=Table3.numFULLOUTERJOINTable4ONTable0.num=Table4.num请建议我应该

SQL获取时间戳差大于30时id的个数

我有以下表格数据结构。我需要找到SESSIONS的数量。SESSIONis:对于一个userid，如果有多行，则检查时间戳。如果时间戳差异小于30，则将其视为一个session。+---------+----------+|userid|timestamp|+---------+----------+|1|10||1|11||1|55||2|65|+---------+----------+在上面的示例中，对于userid1，时间戳10和11被视为单个session。但是(55-11=44)大于30。所以，这是另一个session。因此用户id1和有2个session用户ID2和有1个

SQL 获取 code strong userid hadoop hive

xml - HiveQL & XPath - 如何提取值和替换一些字符

我有一个XMLblob(如下所示)存储在配置单元日志表中。1424324325...firstJoh,n...lastD,oe...hive表中的每一行都有关于不同用户的信息，我想提取uid、名字和姓氏的值(删除名称中的任何逗号)。1424324325JohnDoe1424435463JaneSmith我能够从XML中提取值。SELECTuid,fn,lnFROMlog_tableLATERALVIEWexplode(xpath(logs['users_updates'],'/user/uid/text()'))uidsasuidLATERALVIEWexplode(xpath(log

amp HiveQL code 39 field xml xpath hadoop hive

sql - hadoop操作只写一行？

我正在尝试处理tweets-clean.txt。通过处理，我的意思是获取每个用户标识的较早日期、最新日期和记录数，以及每行中的用户标识本身。我只得到一行，该行中只有最小和最大日期。我做错了什么？CREATETABLEtemptweets16(datestring,useridstring);LOADDATALOCALINPATH'tweets-clean.txt'INTOTABLEtemptweets16;INSERTOVERWRITELOCALDIRECTORY'./hive-output'SELECTuseridasuserid,MIN(FROM_UNIXTIME(UNIX_TIM

hadoop sql section code userid hive

java - 如何为从配置单元 jdbc 查询启动的 mr 作业指定额外的 jar？

我正在尝试通过使用avro存储格式的jdbc查询一个配置单元表，但我在查询产生的mr作业中收到一个类未找到错误。奇怪的是，我可以从配置单元shell运行查询而不会发生异常。我可以运行一个不生成mapreduce作业的查询(select*fromtablelimit10)并且它工作正常。2014-03-1210:23:34,040WARN[main]org.apache.hadoop.mapred.YarnChild:Exceptionrunningchild:java.io.IOException:java.lang.reflect.InvocationTargetExceptiona

配置单何为 java apache hadoop jdbc hive avro

hadoop - 使用 pig/hive 进行半结构化数据处理

我有如下所示的半结构化数据:col1col2col3col4123[name#aa,address#[perminentaddress#abc,currentaddress#xyg]]598[address#[perminentaddress#dev,currentaddress#pqr],name#bb]349[name#cc,mobile#111,id#66address#[perminentaddress#abc,currentaddress#xyg]]前三列是固定的，第四列可以包含任何带有键值对的未知数据。键值对可以嵌套，如上例所示。最重要的是第4列的键位置不固定，可以有无限数

结构化 hadoop currentaddress section code hive apache-pig

hadoop - 选择语句错误，应用程序 exitCode 1

我正在处理HortonworksHive。我见过同样类型的错误。但是在exitCode为1的应用程序错误的情况下，底层的MapReduce错误似乎有所不同。在Hive中，语句Select*fromSomeTable;...工作正常，但是SelectcolNamefromSomeTable;...不工作。应用程序错误日志2014-03-1712:49:15,557INFOorg.apache.hadoop.yarn.server.resourcemanager.rmapp.RMAppImpl:application_1395039411618_0001StatechangefromACC

exitCode hadoop java AbstractService service hive hortonworks-data-platform

hadoop - hive有数据字典吗？

hive有数据字典吗？我正在尝试获取配置单元中表的列名。除了describe命令外，类似于oracle查询:SELECTCOLUMN_NAME,DATA_TYPEFROMUSER_TAB_COLUMNSWHERETABLE_NAME=?ORDERBYCOLUMN_ID; 最佳答案 Hive使用外部关系数据库作为其metastore.您可以使用MetastoreAPI(例如MySQL)直接查询配置的Metastore。更高级别的组件是HCatalog，它提供了一个API来访问和操作Metastore。

hadoop hive section noreferrer Metastore data-dictionary

mysql - Sqoop:从 MySQL 导入 Hive 时替换字符？

当从MySQL导入数据到Hive时，我需要在电话号码中删除两个字符+7。以下请求返回SQL错误。我应该使用什么正确的replace命令？sqoopimport--connectjdbc:mysql://server/db--usernamexxxx--passwordyyyy--query'selectname,last_name,email,second_name,Replace(personal_phone,'+7',''),Replace(mobile,'+7',''),Replace(phone,'+7','')来自$CONDITIONS'--target-dir/data/t

mysql Sqoop section code Replace hadoop

hadoop - 安装 Spark Cluster，Hive 的问题

我正在尝试启动Spark/Shark集群，但一直遇到同样的问题。我已按照https://github.com/amplab/shark/wiki/Running-Shark-on-a-Cluster上的说明进行操作并按照说明处理Hive。我认为SharkDriver正在使用另一个版本的Hadoopjar，但不确定原因。这是详细信息，任何帮助都会很棒。星火/鲨鱼0.9.0ApacheHadoop2.3.0Amplabshive0.11斯卡拉2.10.3Java7我已经安装了所有东西，但我收到了一些弃用警告，然后是一个异常:14/03/1411:24:47信息Configuration.d

Cluster hadoop java apache apache-spark shark-sql