HADOOP_PREFIX

hadoop - 对相同的 reduce 任务的两次尝试是否应该继续并行运行？

我的hadoopreduce任务中的Action有外部效果，而且它们不是幂等的。我在任务跟踪器中观察到，尝试了一个reducer，然后启动了同一组键的另一个reducer，而没有杀死原来的reducer。我配置错了吗？这是这个reduce任务的表: 最佳答案这是由于hadoop中的推测执行。如果Hadoop检测到少数集群节点上有一些慢速任务，它是Hadoop指定备份任务的选项。备份任务将优先安排在速度较快的节点上。重复任务中最先完成的任务将成为用于进一步操作的任务。您可以通过将以下参数设置为false来关闭此功能mapred.re

hadoop - 使用 hadoop-functions.sh 启动 hadoop 失败

我尝试启动hadoop，但它失败了，没有任何启动。按照控制台日志。Mac:sbinlqs2$shstart-all.sh/Users/lqs2/Library/hadoop-3.1.1/libexec/hadoop-functions.sh:line398:syntaxerrornearunexpectedtoken`我已经尝试过任何方法来解决它，但没有任何反应。即使我重新安装了最新版本。但是错误是一样的。这几乎让我发疯。任何答案都是有帮助的。谢谢。最佳答案 Hadoop脚本需要bash，而不是sh$chmod+xstart-al

hadoop hadoop-functions section Library

hadoop - 同时使用 max 和 sum

我有一种情况，我必须求和并最大数量来处理多个每天条目。我在clouderahive中有一个输入表:----------------------------date1|date2|qty----------------------------20180101|20180101|50----------------------------20180101|20180101|15----------------------------20180101|20180102|1----------------------------20180101|20180103|3--------------

hadoop max 20180101 date section hive cloudera

hadoop - Hive:如何处理数据文件中有分隔符的文件？

我有以下数据需要插入到配置单元表中。数据在文件中具有默认分隔符。如何插入到Hive表中？10,Andrew,Man”,”ager,DE,PC11,Arun,Manager,NJ,PC12,Harish,Sales,NJ,MAC13,Robert,Manager,PA,MAC14,Laura,Engineer,PA,MAC谢谢! 最佳答案尝试使用CSVSerdecreatetabletest_table(idint,...)ROWFORMATSERDE'org.apache.hadoop.hive.serde2.OpenCSVSer

何处 hadoop section 34 code hive bigdata hql

hadoop - hortonworks 沙箱 : connection denied

如何通过ssh连接到hortonworks的沙箱(2.5)？sshmaria_dev@127.0.0.1我收到消息:权限被拒绝，请重试最佳答案我整理好了。有必要把端口放在最后。sshmaria_dev@127.0.0.1-p2222 关于hadoop-hortonworks沙箱:connectiondenied，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questions/52163040/

沙箱 hortonworks section code hadoop sandbox hortonworks-data-platform

hadoop - Hive - 将 'yyyy-MM-dd' 之类的字符串转换为数据类型为“yyyy-MM-dd”的日期

我在hive中有一个外部表，它的列为report_dt，数据类型为string，其值类似于2018-09-022018-09-03而且我想根据写在这个外部表上的查询创建托管表，其中report_dt_1作为列，数据类型为date我已经经历了一些线程，我能够像这样查询createtablemanag_newtableasselectto_date(from_unixtime(unix_timestamp(report_dt,'yyyy-MM-dd'),'yyyy-MM-dd'))asreport_dt_1fromexter_table;所以上面的查询创建了一个新表，但是当我descman

yyyy-MM-dd yyyy code section report_dt hadoop hive hiveql

hadoop - Sqoop 停留在进度的 5%

我正在使用Sqoop将数据从Oracle导入到HDFS。当Job启动时，它会停留在5%的进度上大约1小时，并且输出以下信息:INFOmapreduce.Job:TaskId:attempt_1535519556038_0015_m_000037_0,Status:FAILEDContainerlaunchfailedforcontainer_1535519556038_0015_01_000043:org.apache.hadoop.yarn.exceptions.YarnException:Unauthorizedrequesttostartcontainer.Thistokenis

hadoop Sqoop java section code import hdfs

hadoop - 在 socks 代理上访问 GCloud 资源

我正在尝试访问GCloud资源，特别是在端口8088上运行的DataProc的资源管理器HadoopUI。我在GCloud中有以下集群，我在本地通过以下方式创建了一个socks代理:C:\Users\Sujith>gcloudcomputessh"myhadoop-m"--zone=us-east4-c--project=project1234---D10000-N通过公钥认证成功创建隧道接着打开chrome，使用上面创建的隧道启动资源管理器c:\ProgramFiles(x86)\Google\Chrome\Application>chrome.exe"http://myhadoop

上访 hadoop section myhadoop-m code proxy gcloud socks google-cloud-dataproc

docker - Hadoop/Yarn Docker-Container-Executor 由于 "Invalid docker rw mount"而失败

我正在尝试执行Hadoop/Yarn(版本:2.9.1)Docker-Container-Executor的简单示例:vars="YARN_CONTAINER_RUNTIME_TYPE=docker,YARN_CONTAINER_RUNTIME_DOCKER_IMAGE=hadoop-docker"hadoopjarhadoop-examples.jarpi-Dyarn.app.mapreduce.am.env=$vars-Dmapreduce.map.env=$vars-Dmapreduce.reduce.env=$vars10100不幸的是，作业失败并出现以下异常:Failingt

docker Docker-Container-Executor hadoop section hadoop-yarn

Hadoop 流式处理使用 shell 脚本 : reducer fails with error : No such file or directory

我正在使用一个10节点HDP集群，我试图在Bash上使用shell脚本运行一个简单的WordCount作业。下面是我正在使用的命令行参数。yarnjar/usr/hdp/2.6.5.0-292/hadoop-mapreduce/hadoop-streaming-2.7.3.2.6.5.0-292.jar\-mapper'wc-l'\-reducer'./reducer_wordcount.sh'\-file/home/pathirippilly/map_reduce_jobs/shell_scripts/reducer_wordcount.sh\-numReduceTasks1\-in

流式 directory java hadoop apache mapreduce hadoop2 hadoop-streaming

80 81 828384 85 86