run_test

hadoop - 错误 : Failed to create Data Storage while running embedded pig in java

我写了一个简单的程序来测试java中的嵌入式pig在mapreduce模式下运行。我运行的服务器hadoop版本是0.20.2-cdh3u4a，pig版本是0.10.0-cdh3u4a。当我尝试在本地模式下运行时，它运行成功。但是当我尝试以mapreduce模式运行时，它给了我错误。我使用以下命令运行我的程序，如http://pig.apache.org/docs/r0.9.1/cont.html#embed-java中所示javac-cppig.jarEmbedPigTest.javajavac-cppig.jar:.:/etc/hadoop/confEmbedPigTest.jav

hadoop - 使用 hdfs dfs -test 查看目录是否存在

在hadoop文档中:testUsage:hadoopfs-test-[defsz]URIOptions:-d:fthepathisadirectory,return0.-e:ifthepathexists,return0.-f:ifthepathisafile,return0.-s:ifthepathisnotempty,return0.-z:ifthefileiszerolength,return0.Example:hadoopfs-test-efilename如果hdfs目录不存在，我想做点什么。-test选项中的每个参数都返回0。如果目录不存在，我该如何输出？drwx-----

hadoop hdfs bli1 bli

hadoop - Spark 1.3.0 : Running Pi example on YARN fails

我有Hadoop2.6.0.2.2.0.0-2041和Hive0.14.0.2.2.0.0-2041使用命令构建Spark后:mvn-Pyarn-Phadoop-2.4-Dhadoop.version=2.6.0-Phive-Phive-thriftserver-DskipTestspackage我尝试使用以下命令在YARN上运行Pi示例:exportHADOOP_CONF_DIR=/etc/hadoop/conf/var/home2/test/spark/bin/spark-submit\--classorg.apache.spark.examples.SparkPi\--maste

Running example hadoop yarn 1427875242006 apache-spark hadoop-yarn

testing - Oozie:在本地测试工作流程

基于OoozieXML的工作流定义容易出错，并且在运行时难以调试。此外，在生产环境中运行它们存在一定风险。1)是否有一种简单的方法来测试基于oozie的工作流/应用程序；通过嵌入式服务器或其他模拟环境？2)关于oozie开发是否有任何完善的IDE/TDD习语？最佳答案 MiniOozie可能会有所帮助。还使用-dryrun允许打印1个具体化的已解析xml并进行语法检查-http://oozie.apache.org/docs/3.3.2/DG_CommandLineTool.html#Dryrun_of_Coordinator_J

工作流程 testing section Dryrun_of_Coordinator_Job oozie hadoop configuration ide

java - 亚马逊电子病历 : running Custom Jar with input and output from S3

我正在尝试运行具有自定义jar步骤的EMR集群。该程序从S3获取输入并输出到S3(或者至少这是我想要完成的)。在步骤配置中，我在参数字段中有以下内容:v3.MaxTemperatureDrivers3n://hadoopbook/ncdc/alls3n://hadoop-szhu/max-temp其中hadoopbook/ncdc/all是包含输入数据的存储桶的路径(作为旁注，我正在运行的示例来自此book)，并且hadoop-szhu是我自己的存储桶，我想在其中存储输出。按照这个post，我的MapReduce驱动程序如下所示:packagev3;importorg.apache.h

病历 running hadoop apache java amazon-web-services amazon-s3 emr

unit-testing - hadoop mapreduce 作业的最佳单元测试工具/方法

我是新来的，但需要知道对通过ApacheHadoop编写的程序进行单元测试的最佳方法。我知道我们可以用jUnit方式为map和reduce方法中的逻辑编写单元测试用例。我们也可以对涉及的其他逻辑做同样的事情，但这并不能保证它经过良好的测试并且可以在实际运行环境中工作。我读过关于MRUnit的文章，但它似乎也与我上面提到的类似，但方式更成熟。但它也不会作为真正的mapreduce工作运行，而是一个被mock的工作。任何帮助，将不胜感激。谢谢。最佳答案你当然有其他选择。稍微用谷歌搜索一下，你自己就会得到它。在这里，我为您做到了!这是

测试工具 unit-testing 行器 Hadoop br mapreduce

hadoop - Cloudera CDH 中的 hadoop-examples* 和 hadoop-test* jar 在哪里？

我正在寻找能够运行与示例和测试jar关联的hadoop作业的jar文件。过去它们在/usr/lib/hadoop下，但现在显然不在了。感谢指点。注意:本题原为CDH4.2。但是一些答案包括更高版本的信息最佳答案 find/-namehadoop-mapreduce-examples*.jar/usr/lib/hadoop-mapreduce/hadoop-mapreduce-examples-2.0.0-cdh4.7.0.jar/usr/lib/hadoop-mapreduce/hadoop-mapreduce-examples.

hadoop hadoop-examples section mapreduce cloudera

hadoop - IO异常 : Filesystem closed exception when running oozie workflow

我们在oozie中运行一个工作流。它包含两个操作:第一个是在hdfs中生成文件的mapreduce作业，第二个是将文件中的数据复制到数据库的作业。两个部分都成功完成，但oozie在最后抛出一个异常，将其标记为失败的过程。这是异常(exception)情况:2014-05-2017:29:32,242ERRORorg.apache.hadoop.security.UserGroupInformation:PriviledgedActionExceptionas:lpinsight(auth:SIMPLE)cause:java.io.IOException:Filesystemclosed

Filesystem exception hadoop apache java oozie

hadoop - java.net.ConnectException : Connection refused error when running Hive 异常

我正在尝试完成配置单元教程，我在其中输入了以下内容:loaddatalocalinpath'/usr/local/Cellar/hive/0.11.0/libexec/examples/files/kv1.txt'overwriteintotablepokes;这会导致以下错误:FAILED:RuntimeExceptionjava.net.ConnectException:Calltolocalhost/127.0.0.1:9000failedonconnectionexception:java.net.ConnectException:Connectionrefused我看到SA上

ConnectException Connection section code hadoop hive

hadoop - 为什么 YARN 作业不转换到 RUNNING 状态？

我有许多要运行的Samza作业。我可以让第一个运行正常。但是，第二个作业似乎处于ACCEPTED状态，并且在我杀死第一个作业之前永远不会转换到RUNNING状态。这是YARNUI的View:这是第二个作业的详细信息，您可以在其中看到没有分配任何节点:我有2个数据节点，所以我应该能够运行多个作业。这是我的yarn-site.xml的相关部分(我在文件中唯一的其他配置是与HA配置、Zookeeper等有关):yarn.scheduler.minimum-allocation-mb128Minimumlimitofmemorytoallocatetoeachcontainerrequesta

RUNNING hadoop resourcemanager yarn hadoop-yarn apache-samza

270 271 272273274 275 276