草庐IT

input-container

全部标签

sql - 失败 : ParseException line 1:36 cannot recognize input near '1987'

我正在尝试用它在Hive中创建一个外部表CREATEEXTERNALTABLEIFNOTEXISTS1987(YEARINT,MONTHINT,DAYOFMONTHINT,DAYOFWEEKINT,DEPTIMEINT,CRSINT,ARRTIMETIME,CARRIERSTRING,FLIGHTNUMINT,TAILNUMSTRING,ACTUALELAPSEDINT,CRSELAPSEDINT,AIRTIMEINT,ARRDELAYINT,DEPDELAYINT,ORIGINSTRING,DESTSTRING,DISTANCEINT,TAXIININT,TAXIOUTINT,CAN

Hadoop 纱 : Failed to launch container

在运行Hive查询时,我的Hadoop2.3.0集群中的数据节点出现内存不足错误。我应该查看哪些设置以防止节点管理器出现故障?2014-04-2912:03:33,505WARNorg.apache.hadoop.yarn.server.nodemanager.containermanager.launcher.ContainerLaunch:Failedtolaunchcontainer.java.lang.OutOfMemoryError:Javaheapspaceatjava.lang.ClassLoader.findLoadedClass0(NativeMethod)atjav

hadoop - YARN JobHistory 错误 : Failed redirect for container

我们最近用CDH5(2.3.0-cdh5.1.3)部署了YARN,集群正在运行文件,作业也在运行。但是如果作业完成(成功/失败),我们无法从资源管理器UI访问日志,我们会收到以下错误Failedredirectforcontainer_1412716537481_0322_01_000001Failedwhiletryingtoconstructtheredirecturltothelogserver.LogServerurlmaynotbeconfiguredContainerdoesnotexist.还有一些运行作业的异常:Causedby:org.apache.hadoop.ip

hadoop - YARN-Cgroups : Failed to initialize container executor in non-secure cluster

我正在尝试在非安全模式下将cgroups与YARN2.6.0结合使用。有用如果我使用DefaultContainerExecutor就好了。但是,当我尝试使用LinuxContainerExecutor时出现错误。现在,当我执行-->$yarnnodemanager时,它失败了ExitCodeExceptionexitCode=24:File/home/hduser2/hadoop/hadoop-2.6.0/etc/hadoopmustbeownedbyroot,butisownedby1001atorg.apache.hadoop.util.Shell.runCommand(Shel

Hadoop 2.7.1 - 映射减少错误 : Diagnostics: Exception from container-launch

我刚刚将hadoop从2.6.0升级到2.7.1,我所有针对hbase-1.1.1的mapreduces开始失败。我在资源管理器中得到的错误是:Diagnostics:Exceptionfromcontainer-launch.Containerid:container_e08_1439909765014_0004_02_000001Exitcode:1Stacktrace:ExitCodeExceptionexitCode=1:atorg.apache.hadoop.util.Shell.runCommand(Shell.java:545)atorg.apache.hadoop.ut

hadoop - Spark YARN 配置问题 : Container keep failing

我正在尝试将数据框保存为文本文件,但即使是小数据也需要很多时间。我相信我的配置有问题。有人可以告诉我我在这里做错了什么吗?spark.default.parallelism640spark.hadoop.fs.s3.cse.plaintextLength.enabledfalsespark.hadoop.fs.s3n.filestatuscache.enabletruespark.hadoop.mapreduce.input.fileinputformat.split.maxsize33554432spark.executor.iddriverspark.executor.instan

hadoop - "Container is running beyond physical memory limits"

我正在从事一项工作,其中Hive查询使用R文件,分布在集群上以在每个节点上运行。像那样:ADDFILEShdfs://path/reducers/my_script.RSEThive.mapred.reduce.tasks.speculative.execution=false;SETmapred.reduce.tasks=80;INSERTOVERWRITETABLEfinal_output_tablePARTITION(partition_column1,partition_column2)SELECTselected_column1,selected_column2,partit

hadoop - Airflow 失败 : ParseException line 2:0 cannot recognize input near

我正在尝试在Airflow上运行测试任务,但我不断收到以下错误:FAILED:ParseException2:0cannotrecognizeinputnear'create_import_table_fct_latest_values''.''hql'这是我的AirflowDag文件:importairflowfromdatetimeimportdatetime,timedeltafromairflow.operators.hive_operatorimportHiveOperatorfromairflow.modelsimportDAGargs={'owner':'raul','s

hadoop - "the container format for fields in a row"对文件格式意味着什么?

来自Hadoop:权威指南:TherearetwodimensionsthatgoverntablestorageinHive:therowformatandthefileformat.Therowformatdictateshowrows,andthefieldsinaparticularrow,arestored.InHiveparlance,therowformatisdefinedbyaSerDe,aportmanteauwordforaSerializer-Deserializer.Whenactingasadeserializer,whichisthecasewhenque

Hadoop MapReduce : Is it possible to only use a fraction of the input data as the input to a MR job?

我的输入数据的关键类是WritableComparable,它以MapFile的形式存在。有没有什么方法可以设置最小和最大键值,并且只将记录传输到键值介于两者之间的映射器? 最佳答案 这是不可能的。因为对于map-reduce作业,我们只是指定输入。我们可以做的一件事是,在映射器中编写一个条件。如果键是黑白最小值和最大值,则只处理键值对并将输出发送到reducer。否则,什么都不做。但即使在这种情况下,我们的map阶段也会处理所有输入,而reduce阶段只会处理我们指定的键范围。更好的方法:当在给定输入上运行map-reduce作业