草庐IT

test_hive

全部标签

hadoop - 得到错误的 FS : file while running hive query

在hive上运行一个简单的选择查询时我遇到了这个奇怪的错误java.lang.IllegalArgumentException:WrongFS:file://usr/lib/hive/lib/CustomUDFint.jar,expected:file:///atorg.apache.hadoop.fs.FileSystem.checkPath(FileSystem.java:410)atorg.apache.hadoop.fs.RawLocalFileSystem.pathToFile(RawLocalFileSystem.java:56)atorg.apache.hadoop.fs

hadoop - hive 选择列做一个案例陈述

这会将数据从dynamodb动态导出到s3。--LoadS3TablewithdatafromDynamoDBINSERTOVERWRITETABLEs3_tableSELECT*FROMdynamodb_table;问题是它留下了一堆\N。我可以手写它看起来像--LoadS3TablewithdatafromDynamoDBINSERTOVERWRITETABLEs3_tableSELECTDCS_ID,CASEWHENMAKEISNULLTHEN""ELSEMAKEEND,CASEWHENMODELISNULLTHEN""ELSEMODELENDFROMdynamodb_table

hadoop - 如何使用flume创建任务自动定时从HDFS加载数据到HIVE?

我需要将数据从hadoop自动加载到hive,但我不想设置其他服务来执行此操作。我已经使用flume来收集我的日志了……那我该怎么办呢?flume是否可以执行命令(查询hive就像LOAD.....)? 最佳答案 抱歉,我来晚了一点,但实际上我已经整理了一个非常完整的示例,说明如何执行此操作并公开了所有细节。也许,它会帮助别人http://www.lopakalogic.com/articles/hadoop-articles/log-files-flume-hive/祝你好运! 关于h

hadoop - 启用安全性的 Hive 创建权限

我已将Kerberos设置为hive的安全模型,但我正在努力获得正确的权限。现在用户可以很好地创建和删除数据库,但不能创建表:hive>showdatabases;OKcpenneydefaultTimetaken:0.051seconds,Fetched:2row(s)hive>dropdatabasecpenney;OKTimetaken:0.098secondshive>createdatabasecpenney;OKTimetaken:0.062secondshive>createtabletest(hostgroupSTRING);Authorizationfailed:No

hadoop - Hive CLI 无法从另一个表创建表

我一直在尝试创建一个包含来自另一个表的列的表,但HiveCLI始终无法这样做。查询如下:CREATETABLEtweets_id_sampleASSELECTidFROMtweets_sample;伴随此Hive查询的CLI错误如下:TotalMapReducejobs=3LaunchingJob1outof3Numberofreducetasksissetto0sincethere'snoreduceoperatorStartingJob=job_201310250853_0023,TrackingURL=http://sandbox:50030/jobdetails.jsp?job

sql - 选择 Hive 表中的第一个匹配项

我在hive上有一个表A,如下所示:idmstsaction1231000sleep1231010eat1232001sleep4561200eat4561500drink我想要的是为每个id选择与min(tmst)对应的整个集合。我可以通过运行select*fromAt1semileftjoin(selectid,min(msts)asmstsfromAgroupbyid)t2ont1.id=t2.idandt1.msts=t2.msts;但我想看看我是否可以在没有连接(或自定义reducer)的情况下完成它,因为它很耗时。编辑:澄清一下:我想要得到的是每个id执行的第一个操作(ac

mysql - Hive Metastore 未创建 MYSQL 或 Derby 连接

HiveMetastore未创建MYSQL或Derby连接。Derby战schematool-dbTypederby-initSchemaMetastoreconnectionURL:jdbc:mysql://localhost/metastoreMetastoreConnectionDriver:com.mysql.jdbc.DriverMetastoreconnectionUser:hiveschematool-dbTypederby-infoMetastoreconnectionURL:jdbc:mysql://localhost/metastoreMetastoreConnec

mysql - 无法使用 Sqoop 将数据从 Hive 导出到 MySQL

我正在使用Sqoop从以Hive格式存储的HDFS将处理后的数据导出到MySQL服务器。代码简单明了,但无论我做什么,Sqoop都无法正确识别字段分隔符。可能是什么问题?这是我在Hive中的表定义hive>showcreatetabledatabase.weblog_ag;OKCREATETABLEdatabase.weblog_ag(visitor_idstring,timearray,urlarray,client_timearray,resolutionarray,browserarray,osarray,devicetypearray,devicemodelarray,ipin

hadoop - DataStax Enterprise 3.2-Hive S3 NoSuchBucket

我正在运行启用了分析的DSE3.2.4。我正在尝试将我的一张表卸载到S3中以进行长期存储。我在配置单元中创建了下表:CREATEEXTERNALTABLEevents_archive(event_idstring,timestring,typestring,sourcestring,valuestring)PARTITIONEDBY(yearstring,monthstring,daystring,hourstring)ROWFORMATDELIMITEDFIELDSTERMINATEDBY'\t'LOCATION's3n://com.mydomain.events/';然后我尝试使用

hadoop - yarn 上的 Apache Hive

根据我对博客的理解,Yarn(mapred2)比hadoop的mapreduce更快或更智能。如果它是真的,有没有办法配置Hive以使用Yarn/Mapred2而没有任何复杂性来提高性能或增加资源利用率? 最佳答案 Hive在Yarn的开箱即用映射上运行。但是在Yarn上运行一个旧的Hive不会是惊天动地的体验,你可能会测量相同的时间。您想要的是获得最新的Hive开发和改进(例如ORCandVectorization),也许尝试运行HiveonTez.我建议阅读Stinger并检查这个deploymentguide.