草庐IT

sql - 在 hive 表中插入的值,双引号用于来自 csv 文件的字符串

我正在将一个csv文件导出到配置单元表中。关于csv文件:列值用双引号括起来,用逗号分隔。来自csv的示例记录"4","good""3","notbad""1","veryworst"我用下面的语句创建了一个hive表,创建外部表currys(review_ratingstring,review_commentstring)由','分隔的行格式字段;表已创建。现在我使用命令loaddatalocalinpath加载了数据并且成功了。当我查询表格时,select*fromcurrys;结果是:"4""good""3""notbad""1""veryworst"代替4good3notbad

hadoop - oozie Sqoop 操作无法将数据导入配置单元

我在执行ooziesqoop操作时遇到问题。在日志中,我可以看到sqoop能够将数据导入临时目录,然后sqoop创建配置单元脚本来导入数据。将临时数据导入配置单元时失败。在日志中我没有收到任何异常。下面是我正在使用的sqoopAction。hcat.metastore.uri${HIVE_THRIFT_URL}hcat.metastore.principal${KERBEROS_PRINCIPAL}${jobTracker}${nameNode}/tmp/hive-oozie-site.xmloozie.hive.defaults/tmp/hive-oozie-site.xmljob-

hadoop - Hive:每当它触发 map reduce 时,它​​都会给我这个错误 "Can not create a Path from an empty string",我该如何调试?

我正在使用hive0.10以及何时使用hive-e"showtables",hive-e"desctable_name"itworks!但是当我执行类似hive-e"selectcount(*)table_name使用旧版本的配置单元和新集群抛出此错误。调试此类问题的正确方法应该是什么,没有从谷歌找到任何解决问题的方法。java.lang.IllegalArgumentException:CannotcreateaPathfromanemptystringatorg.apache.hadoop.fs.Path.checkPathArg(Path.java:91)atorg.apache

hadoop - 通过 Hive JDBC Hive over Tez - 错误

我正在使用HortonworksHadoopHDP-2.3.2.0-2950在Tez引擎上hive以下2个查询来自Java代码。select*fromascii--效果很好selectcount(*)fromascii或selectcount(1)fromascii--失败,错误输出我的代码:packagecom.hadoop.hive;importjava.sql.Connection;importjava.sql.DriverManager;importjava.sql.PreparedStatement;importjava.sql.ResultSet;importjava.sq

hadoop - hive 不允许冒充 hive

我有一个配置了hadoop2.7.2和hive2.1.0的hadoop集群。我正在使用beeline通过以下命令连接到配置单元:beelinebeeline>!connectjdbc:hive2://localhost:10000Enterusernameforjdbc:hive2://localhost:10000:首先,键入任意用户名都可以成功连接到hive。但是,配置以下设置后,出现错误。//withinhive-site.xmlandhiveserver2-site.xmlhive.server2.enable.doAstrueSettingthispropertytotrue

java - 无法在 Spark 中配置 ORC 属性

我正在使用Spark1.6(Cloudera5.8.2)并尝试了以下方法来配置ORC属性。但不影响输出。下面是我试过的代码片段。DataFramedataframe=hiveContext.createDataFrame(rowData,schema);dataframe.write().format("orc").options(newHashMap(){{put("orc.compress","SNAPPY");put("hive.exec.orc.default.compress","SNAPPY");put("orc.compress.size","524288");put("

hadoop - 如何在配置单元中获取复杂数据类型列的长度

我有一个配置单元表包含array和map类型的列,我想过滤记录,其中array/map列包含超过N元素,该怎么做?DDL:createtabletest(idstring,v1array,v2map)查询:select*fromtestwherelength(v1)>10orlength(v2)>10 最佳答案 select*fromtestwheresize(v1)>10orsize(v2)>10演示createtabletest(idstring,v1array,v2map);insertintotestselect1,arra

hadoop - 在 Hive 中使用排序表

总结:我觉得我的系统忽略了预排序表的概念。-我希望在排序步骤上节省时间,因为我正在使用预先排序的数据,但查询计划似乎表明中间排序步骤。肮脏的细节如下:设置=======我设置了以下标志:=============sethive.enforce.bucketing=true;setmapred.reduce.tasks=8;setmapred.map.tasks=8;这里我创建了一个表来保存磁盘上的临时数据副本========CREATETABLEtrades(symbolSTRING,exchangeSTRING,priceFLOAT,volumeINT,condINT,bidFLOA

ubuntu - 在 Ubuntu 上安装 Hive

我想在我的Ubuntu上安装Hive。我阅读了this文章,对我帮助很大。我做了除第4步以外的所有步骤。我不明白这一步应该做什么。你能详细解释一下这一步吗? 最佳答案 第1步:下载并提取HadoopStep2:SetJAVA_HOMEpathtoconf/hadoop-env.sh//这一步是为hadoop设置java路径第3步:conf/core-site.xml:fs.default.name//Placeyourhomefolderhereforusinghadoophdfs://localhost:9000第4步:conf/

sql-server - 如何使用 Sqoop 将数据从关系数据库导入沙箱 Hive?

如何使用Sqoop将数据从关系数据库导入沙盒中的Hive。我在我的电脑上安装了HortonWorks沙箱。Nw我想知道这个迁移。我已经引用了这个链接http://hortonworks.com/kb/using-apache-sqoop-for-data-import-from-relational-dbs/但我有些疑惑1、运行需要Sqoop软件吗?2,在上面提到的链接中有一些代码,我将把这段代码放在哪里?在Hive查询窗口中?3、是否可以完全迁移数据库(或仅按时间表迁移)?4、存储过程和Viwes我将把所有这些都保存在哪里? 最佳答案