草庐IT

about_Execution_Policies

全部标签

hadoop - Hive 存档分区(动态)失败 : Execution Error, 从 org.apache.hadoop.hive.ql.exec.DDLTask 返回代码 1

我正在尝试从我的表中归档一些旧数据。使用ALTERTABLETABLE_NAMEARCHIVEPARTITION(part_col)查询。Hadoopversion-2.7.3Hiveversion-1.2.1表结构如下,hive>descclicks_fact;OKtimetimestampuser_idvarchar(32)advertiser_idintbuy_idintad_idintcreative_idintcreative_versionsmallintcreative_sizevarchar(10)site_idintpage_idintkeywordvarchar(4

hadoop - 组织.apache.ignite.IgniteException : For input string: "30s" in ignite hadoop execution

我想在apacheignite上执行Hadoop的字数统计示例。我在ignite中使用IGFS作为HDFS配置的缓存,但是在通过Hadoop提交作业以在ignite上执行后,我遇到了以下错误。提前感谢任何可以帮助我的人!Usingconfiguration:examples/config/filesystem/example-igfs-hdfs.xml[00:47:13]__________________________[00:47:13]/_/___/|//_/___/__/[00:47:13]_///(77//////_/[00:47:13]/___/\___/_/|_/___/

hadoop - 从 org.apache.hadoop.hive.ql.exec.DDLTask 创建配置单元表 : FAILED: Execution Error, 返回代码 1 时出错。元异常

我有一个多节点hadoop集群,现在我在namenode上安装了hive。我试图从存储在hdfs中的文件创建一些配置单元表,但我收到了这个奇怪的错误:FAILED:ExecutionError,returncode1fromorg.apache.hadoop.hive.ql.exec.DDLTask.MetaException(message:hdfs://namenode-VirtualBox:9000/data/posts/posts.tblisnotadirectoryorunabletocreateone)hive>但是,然后我尝试从存储在hdfs中的文件创建一个表,只有2kb

hadoop - 失败 : Execution Error, 从 org.apache.hadoop.hive.ql.exec.DDLTask 返回代码 1。组织/apache/hadoop/hive/serde2/SerDe

我正在将Twitter数据处理到Hive外部表,但在创建Hive外部表时出现错误。请查看下面的我的代码。添加了jar文件以移动hive/lib位置。使用以下命令添加到jar文件配置单元我在配置单元库目录中添加了流动的jar:ADDJAR/usr/local/hive/lib/hive-serdes-1.0-SNAPSHOT.jar;请找到外部配置单元表:CREATEEXTERNALTABLEMytweets_raw(idBIGINT,created_atSTRING,sourceSTRING,favoritedBOOLEAN,retweet_countINT,retweeted_sta

hadoop - 失败 : Execution Error, 从 org.apache.hadoop.hive.ql.exec.spark.SparkTask 返回代码 2

我在跑apache-hive-1.2.1-binhadoop-2.7.1spark-1.5.1-bin-hadoop2.6我能够在Spark上配置配置单元,但是当我尝试执行查询时,它会给我以下错误消息。hive>SELECTCOUNT(*)ASrcount,yomFromserviceGROUPBYyom;QueryID=hduser_20160110105649_4c90528a-76ba-4127-8849-54f2152be817Totaljobs=1LaunchingJob1outof1Inordertochangetheaverageloadforareducer(inbyt

hadoop - 在 vectorized.execution.enabled 时将 ORC 文件格式与 Hive 一起使用时发生 ClassCastException

我有一个具有以下属性的配置单元表-ORC存储格式事务性=true按4个键分区-年、月、日、小时由groupingKey存储我正在使用HiveStreaming将数据直接填充到表中。现在我的问题是-我正在尝试运行以下查询selectcount(*)fromtable_name;我遇到异常Causedby:java.lang.ClassCastException:org.apache.hadoop.hive.ql.io.orc.OrcStruct$OrcStructInspectorcannotbecasttoorg.apache.hadoop.hive.serde2.objectinsp

Hadoop Map-Reduce : what you can tell about a state: mappers: 80%, reducer :20%

在采访中有人问我一个问题:关于状态,你能说些什么:映射器:80%,缩减器:20%?我的理解是,进入那种状态是不可能的。因为在reducer开始工作之前,所有映射器都应该完成运行:收集所有键值对并按键分组。我说的对吗? 最佳答案 Reducers为20%意味着后台线程已开始将数据从mapper输出位置复制到reducer输入位置。这就是为什么在映射器输出达到100%之前,reducers进度显示为20%。 关于HadoopMap-Reduce:whatyoucantellaboutasta

java - 当 hive.execution.engine 值其 tez 时出现 NoSuchMethodError

我正在使用hive1.0.0和apachetez0.4.1当我将配置单元配置为使用tez时,出现异常。在hive-site.xml中,当hive.execution.engine值为mr时,它工作正常。但是如果我将它设置为tez我会得到这个错误:Exceptioninthread"main"java.lang.NoSuchMethodError:org.apache.tez.mapreduce.hadoop.MRHelpers.updateEnvBasedOnMRAMEnv(Lorg/apache/hadoop/conf/Configuration;Ljava/util/Map;)Va

grails - 亚马逊 Redshift : query execution hangs

我使用amazonredshift,有时查询执行挂起,没有任何错误消息,例如此查询将执行:selectextract(yearfromdate),extract(weekfromdate),count(*)fromsome_tablewheredate>'2015-01-0100:00:00'anddate这不是:selectextract(yearfromdate),extract(weekfromdate),count(*)fromsome_tablewheredate>'2014-01-0100:00:00'anddate但只有当我将项目部署到服务器并且在我的本地计算机上执行所有

hadoop - Spark 流 : Micro batches Parallel Execution

我们正在从Kafka的sparkstreaming中接收数据。一旦在SparkStreaming中开始执行,它只执行一个批处理,其余批处理开始在Kafka中排队。OurdataisindependentandcanbeprocessesinParallel.我们尝试了具有多个执行器、内核、背压和其他配置的多种配置,但到目前为止没有任何效果。有很多消息在排队,一次只处理了一个微批处理,其余的都留在队列中。我们希望最大程度地实现并行性,以便没有任何微批处理排队,因为我们有足够的可用资源。那么我们如何通过最大限度地利用资源来减少时间。//StartreadingmessagesfromKaf