hive-overwrite

hadoop - 我们如何将多个 hql 文件传递给 hive/beeline？

我想在一个配置单元session中运行file_1.hql和file_2.hql。我怎样才能做到这一点？我正在考虑将这两个文件作为hive-ffile_1.hqlfile_2.hql传递。但是-f只需要一个文件。有什么建议吗？最佳答案使用bash怎么样:hive-e"$(catfile1.hqlfile2.hql)" 关于hadoop-我们如何将多个hql文件传递给hive/beeline？，我们在StackOverflow上找到一个类似的问题： ht

传递 beeline section file hql hadoop hive

hadoop - 无法将数据从 CSV 文件加载到 HIVE

我在将数据从CSV文件加载到配置单元外部表时得到“无”值。我的CSV文件结构是这样的:creation_month,accts_created7/1/2018,408476/1/2018,672165/1/2018,760094/1/2018,876113/1/2018,996872/1/2018,926311/1/2018,11195112/1/2017,107717'creation_month'和'accts_created'是我的列标题。createexternaltablemonthly_creation(creation_monthDATE,accts_createdINT

hadoop HIVE section creation 2018 null hdfs

hadoop - Hadoop 集群上的 Hive/Map-Reduce 作业 : How to (roughly) calculate the diskspace needed?

以下用例:我对.gz压缩大小约为500GB的数据运行配置单元查询:selectcount(distinctc1),c2fromt1groupbyc2;此查询产生约2800个映射作业和约400个缩减作业。在设置具有20个实例(每个160GB实例存储)的Hadoop集群时，该工作将停止在97%map和21%reduceprogress，然后回落到94%map和19%reduceprogress，然后就没有任何进展了。我认为这是因为HDFS的磁盘空间已达到使用限制。也许我可以在当天晚些时候提供异常消息。如何:有没有办法根据正在处理的数据的输入大小粗略地预先计算所需的HDFS磁盘空间？请记住，

Map-Reduce calculate hadoop apache java mapreduce hive hdfs elastic-map-reduce

hadoop - 得到错误的 FS : file while running hive query

在hive上运行一个简单的选择查询时我遇到了这个奇怪的错误java.lang.IllegalArgumentException:WrongFS:file://usr/lib/hive/lib/CustomUDFint.jar,expected:file:///atorg.apache.hadoop.fs.FileSystem.checkPath(FileSystem.java:410)atorg.apache.hadoop.fs.RawLocalFileSystem.pathToFile(RawLocalFileSystem.java:56)atorg.apache.hadoop.fs

running hadoop section RawLocalFileSystem hive

hadoop - hive 选择列做一个案例陈述

这会将数据从dynamodb动态导出到s3。--LoadS3TablewithdatafromDynamoDBINSERTOVERWRITETABLEs3_tableSELECT*FROMdynamodb_table;问题是它留下了一堆\N。我可以手写它看起来像--LoadS3TablewithdatafromDynamoDBINSERTOVERWRITETABLEs3_tableSELECTDCS_ID,CASEWHENMAKEISNULLTHEN""ELSEMAKEEND,CASEWHENMODELISNULLTHEN""ELSEMODELENDFROMdynamodb_table

陈述 hadoop code section pre amazon-web-services amazon-s3 hive amazon-dynamodb

hadoop - 如何使用flume创建任务自动定时从HDFS加载数据到HIVE？

我需要将数据从hadoop自动加载到hive，但我不想设置其他服务来执行此操作。我已经使用flume来收集我的日志了……那我该怎么办呢？flume是否可以执行命令(查询hive就像LOAD.....)？最佳答案抱歉，我来晚了一点，但实际上我已经整理了一个非常完整的示例，说明如何执行此操作并公开了所有细节。也许，它会帮助别人http://www.lopakalogic.com/articles/hadoop-articles/log-files-flume-hive/祝你好运! 关于h

hadoop flume section articles hive

hadoop - 启用安全性的 Hive 创建权限

我已将Kerberos设置为hive的安全模型，但我正在努力获得正确的权限。现在用户可以很好地创建和删除数据库，但不能创建表:hive>showdatabases;OKcpenneydefaultTimetaken:0.051seconds,Fetched:2row(s)hive>dropdatabasecpenney;OKTimetaken:0.098secondshive>createdatabasecpenney;OKTimetaken:0.062secondshive>createtabletest(hostgroupSTRING);Authorizationfailed:No

hadoop Hive gt cpenney

hadoop - Hive CLI 无法从另一个表创建表

我一直在尝试创建一个包含来自另一个表的列的表，但HiveCLI始终无法这样做。查询如下:CREATETABLEtweets_id_sampleASSELECTidFROMtweets_sample;伴随此Hive查询的CLI错误如下:TotalMapReducejobs=3LaunchingJob1outof3Numberofreducetasksissetto0sincethere'snoreduceoperatorStartingJob=job_201310250853_0023,TrackingURL=http://sandbox:50030/jobdetails.jsp?job

hadoop Hive INFO 10 07 hiveql hortonworks-data-platform beeswax

sql - 选择 Hive 表中的第一个匹配项

我在hive上有一个表A，如下所示:idmstsaction1231000sleep1231010eat1232001sleep4561200eat4561500drink我想要的是为每个id选择与min(tmst)对应的整个集合。我可以通过运行select*fromAt1semileftjoin(selectid,min(msts)asmstsfromAgroupbyid)t2ont1.id=t2.idandt1.msts=t2.msts;但我想看看我是否可以在没有连接(或自定义reducer)的情况下完成它，因为它很耗时。编辑:澄清一下:我想要得到的是每个id执行的第一个操作(ac

Hive sql code section msts hadoop

mysql - Hive Metastore 未创建 MYSQL 或 Derby 连接

HiveMetastore未创建MYSQL或Derby连接。Derby战schematool-dbTypederby-initSchemaMetastoreconnectionURL:jdbc:mysql://localhost/metastoreMetastoreConnectionDriver:com.mysql.jdbc.DriverMetastoreconnectionUser:hiveschematool-dbTypederby-infoMetastoreconnectionURL:jdbc:mysql://localhost/metastoreMetastoreConnec

Metastore mysql connection hadoop hive derby

60 61 626364 65 66