insert-into

hadoop - Spark 1.2 : Write single record into multiple files (blacklisted)

我尝试将RDD中的每条记录写入多个文件(每个黑名单一个，并按键分组)到HDFS，并在每个文件集上应用黑名单。首先，我将MultipleTextOutputFormat与keyBy结合使用，按记录中的字段对输出文件进行分组，效果很好。所以我的输出文件现在由一个键命名，来自记录，记录在这个文件中分组。但我现在的问题是，我需要在输出上应用黑名单并分别保存这些输出中的每一个。我使用一个简单的过滤器做到了这一点。现在发生的情况是，应用此文件管理器会导致作业针对x个不同的黑名单完成X次。对于大量记录，这是NotAcceptable。即使之前在Dataframe上调用缓存函数。为了弄清楚我想要什么，

blacklisted multiple 黑名 section strong hadoop apache-spark apache-spark-sql

sql - Hive Insert 从一个表覆盖到另一个具有不同列数的表

我有2个配置单元表。源表有以下列:correspondence_id|decimal(22,0)|||template_id|decimal(18,0)|||language_cd|varchar(6)|||delivery_channel_cd|varchar(20)|||job_id|decimal(18,0)|||correspondence_content|string|||create_user_id|varchar(40)|||create_ts|timestamp|||last_updt_user_id|varchar(40)|||last_updt_ts|timesta

同列 Insert create varchar correspondence sql hadoop hive hiveql

Java Spark 将 HIVE View 重制为 INSERT

我有以下从HDFS读取JSON文件并使用Spark将其输出为HIVEView的Java代码。packageorg.apache.spark.examples.sql.hive;importjava.io.File;importjava.io.Serializable;importjava.util.ArrayList;importjava.util.List;importorg.apache.spark.api.java.function.MapFunction;importorg.apache.spark.sql.Dataset;importorg.apache.spark.sql.

INSERT Spark import section java hadoop apache-spark hive

mysql - 使用 drill 修改 RDBMS 时的 UPDATE/INSERT

如果我使用apachedrill并连接到像MySQL这样的RDBMS，我是否能够使用完整的SQL语法(如UPDATE/INSERT)？我看过this关于HDFS上的UPDATE/INSERT的回答，想知道在使用drill和RDBMS时这些是否有任何区别。最佳答案不，不支持。您可以将Drill视为SQL引擎，而不是数据库。SQL引擎旨在尽快对大量数据执行选择语句，以便用户可以回答有关其数据的问题。数据库是具有额外数据管理功能(如插入和更新)的SQL引擎。通常人们在不再变化的数据上使用Drill。例如，如果您正在运行一个网站并且

INSERT UPDATE section stackoverflow code mysql hadoop distributed-computing rdbms apache-drill

postgresql - Put 请求失败 : INSERT INTO "PARTITION_PARAMS" when executing an insert. .select 包含数百个字段的查询

在带有hive3的HortonworksHDP3集群上通过Tez执行插入..选择查询，我收到以下错误:java.sql.SQLException:Errorwhileprocessingstatement:FAILED:ExecutionError,returncode1fromorg.apache.hadoop.hive.ql.exec.MoveTask.MetaException(message:Putrequestfailed:INSERTINTO"PARTITION_PARAMS"("PARAM_VALUE","PART_ID","PARAM_KEY")VALUES(?,?,?

PARTITION_PARAMS postgresql section 34 code hadoop hive hortonworks-data-platform

java - 象夫 : Cannot convert into sequence file

我正在尝试将一些文本文件转换为象夫序列文件。所以我愿意mahoutseqdirectory-iinputFolder-ooutputFolder但我总是遇到这个异常java.lang.Exception:java.lang.RuntimeException:java.lang.reflect.InvocationTargetExceptionatorg.apache.hadoop.mapred.LocalJobRunner$Job.run(LocalJobRunner.java:403)Causedby:java.lang.RuntimeException:java.lang.refl

sequence convert java apache CombineFileRecordReader hadoop mapreduce mahout sequencefile

SQL 查询 : How to select multiple instances of a single item without collapsing into a group?

我正在尝试在Impala中执行SQL查询。我有一个数据表，其中(除其他外)有两列，其值相交多次。例如，假设我们有一个表，其中包含两列相关的姓名和电话号码:姓名电话号码约翰·史密斯(123)456-7890罗伯·约翰逊(123)456-7890格雷格·jackson(123)456-7890汤姆格林(123)456-7890jack·马西斯(123)456-7890约翰·史密斯(234)567-8901罗伯·约翰逊(234)567-8901乔·沃尔夫(234)567-8901迈克·托马斯(234)567-8901吉姆·摩尔(234)567-8901约翰·史密斯(345)678-9012罗

collapsing instances 罗伯 phone_number number sql hadoop impala

hadoop - Hive INSERT OVERWRITE 到 Google Storage 作为 LOCAL DIRECTORY 不起作用

我使用以下Hive查询:hive>INSERTOVERWRITELOCALDIRECTORY"gs://Google/Storage/Directory/Path/Name"rowformatdelimitedfieldsterminatedby','select*from.;我收到以下错误:"Error:FailedwithexceptionWrongFS:"gs://Google/Storage/Directory/PathName",expected:file:///我做错了什么？最佳答案从语法中删除Local。参见下面的

DIRECTORY OVERWRITE section code strong hadoop hive google-cloud-storage google-hadoop

sql INSERT 条件作为选择语句？

我正在尝试用HIVEsql填充一个表。这里的两个表都有相同的列，但我只关心tableSource中尚未在tableDest中的行。表中的行有一个索引字段recordId(不是主要的)。我想添加tableSource中recordId大于tableDest中最高recordId的所有行。我有一个基本的命令结构，但我认为它的语法不正确？INSERTINTOtableDestSELECT*FROMtableSourceWHEREtableSource.recordId>(SELECTMAX(recordId)FROMtableDest);我只想将最后一个select语句的值用于条件。我试过使

INSERT sql recordId tableDest tableSource database hadoop hive

java - HBase 映射减少 : write into HBase in Reducer

我正在学习HBase。我知道如何使用HadoopMapReduce编写Java程序并将输出写入HDFS；但现在我想将相同的输出写入HBase，而不是HDFS。它应该有一些类似的代码，就像我之前在HDFS中所做的那样:context.write(key,value);谁能给我一个例子来实现这个？最佳答案这是一种方法:publicstaticclassMyMapperextendsTableMapper{publicvoidmap(ImmutableBytesWritablerow,Resultvalue,Contextcontex

HBase Reducer section ImmutableBytesWritable java hadoop mapreduce

109 110 111112113 114 115