草庐IT

run_test

全部标签

hadoop - org.apache.hadoop.security.AccessControlException : Permission denied: user=test-user, access=EXECUTE, inode ="system":hadoop:test-user:rwx------

以前测试用户曾经驻留在连接丢失的边缘服务器上。因此,我们重建了边缘服务器并一直在尝试启动并运行它,但我一直收到以下错误。Jobinitializationfailed:org.apache.hadoop.security.AccessControlException:org.apache.hadoop.security.AccessControlException:Permissiondenied:user=test-user,access=EXECUTE,inode="system":hadoop:test-user:rwx------atsun.reflect.GeneratedC

hadoop - 关于 hadoop fs test 命令输出

我在命令下运行,尝试使用文件名存在或文件名不存在,但它们都没有来自控制台的任何输出。我希望如果文件存在,该命令应该返回零?http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-common/FileSystemShell.html#testhadoopfs-test-efilename 最佳答案 我认为这意味着命令的返回码是0。你可以检查hadoopfs-test-efilenameecho$? 关于hadoop

hadoop - Mesos 和 Hadoop : How to get the running job input data size?

我在Mesos0.14上运行Hadoop1.2.1。我的目标是记录输入数据大小、运行时间、cpu使用情况、内存使用情况等,以便稍后进行优化。除了数据大小之外,所有这些都是使用Sigar获得的。有什么方法可以获取正在运行的任何作业的输入数据大小?例如,当我运行hadoop示例的terasort时,我需要在作业实际运行之前获取teragen生成的数据大小。如果我正在运行Wordcountexample,我需要获取wordcount输入文件大小。我需要自动获取数据大小,因为我无法知道稍后将在该框架内运行什么作业。我正在使用Java编写一些mesos库代码。最好,我想在MesosExecuto

hadoop - Spark : ClassNotFoundException when running KafkaWordCount example

我在使用以下命令在我的CDH5集群上使用kafka运行sparkstreaming时遇到问题:spark-submit--masteryarn--deploy-modeclient--classorg.apache.spark.examples.streaming.KafkaWordCount/usr/lib/spark/examples/lib/spark-examples-1.6.0-cdh5.7.0-hadoop2.6.0-cdh5.7.0.jarzk1,zk2,zk3grouptopic1请注意,真正的工作必须在客户端模式下运行,因此部署模式设置。执行上述命令会导致以下异常(驱

hadoop - (Sqoop-import) 错误 tool.ImportTool : Encountered IOException running import job: java. io.IOException:Hive 以状态 9 退出

当我输入命令时:./sqoop-import--connectjdbc:mysql://localhost/sqoop2-tablesqeep2-m1-hive-import当执行这条命令时:hadoop@dewi:/opt/sqoop/bin$./sqoop-import--connectjdbc:mysql://localhost/sqoop2-tablesqeep2-m1-hive-import12/06/2010:00:44INFOtool.BaseSqoopTool:UsingHive-specificdelimitersforoutput.Youcanoverride12/

eclipse - 适用于 Eclipse 的 AWS 工具包 : Running AwsConsoleApp issue?

我是AWS的新手,当我尝试在eclipse中运行AwsConsoleApp.java时,出现以下错误。我已经正确设置了access-id和secret-key。===========================================WelcometotheAWSJavaSDK!===========================================CaughtException:Requesthasexpired.Timestampdateis2013-07-09T06:24:57.628ZReponseStatusCode:400ErrorCode:Req

unit-testing - 如何对 Hadoop Writable 进行单元测试

我自己实现了WritableComparable,但是我找不到适合单元测试write和readFields方法的好东西。有什么想法吗? 最佳答案 也许您可以找到更简单的方法来测试您的可写对象,但手动执行序列化/反序列化也可以。例如:MyUtils.java:...importorg.apache.commons.io.IOUtils;...publicstaticbyte[]serialize(Writablewritable)throwsIOException{ByteArrayOutputStreamout=newByteArr

当我尝试在 YARN 上运行 pi-example 时,Hadoop2.5.2 卡在了 Running Job

我在3台装有UbuntuServer14.04的机器上运行Hadoop2.5.2一个是namenode和resourcemanager,ip是192.168.3.1其他的是运行datanode和nodemanager的slave,ip分别是192.168.3.102和192.168.3.104。我可以毫无错误地运行start-hdfs.sh和start-yarn.sh。HDFS和YARN的网站运行良好,我可以在浏览器上访问这两个网站并查看两个从站的状态。但是当我尝试通过yarnjarhadoop-mapreduce-examples-2.5.2.jarpi14在~/hadoop/sha

sql - Hive: java.lang.OutOfMemoryError: Java heap space and Job running in-process (local Hadoop)

我的设置:运行NixOSLinux的GoogleCloudPlatform中的4节点集群(1个主节点,3个工作节点)。我一直在使用TPC-DS工具包来生成数据和查询都是标准的。在较小的数据集/更简单的查询上,它们工作得很好。我从这里获取的查询:https://github.com/hortonworks/hive-testbench/tree/hdp3/sample-queries-tpcds这是第一个,query1.sql:WITHcustomer_total_returnAS(SELECTsr_customer_skASctr_customer_sk,sr_store_skASct

unit-testing - 如何在 oozie 工作流中运行 hadoop 示例 jar?

这让我发疯了——我觉得自己像个白痴,想弄清楚如何做到这一点!我正在构建一个使用Oozie客户端库来运行工作流的应用程序。真的很简单,我想为我的代码构建一些测试,这样我就可以检查我是否在做正确的事情实际代码-感谢oozie客户端库-非常简单。我已经安装了Hadoop并且可以运行标准的wordcount提供的示例,没有任何问题,但是我不知道如何通过Oozie运行东西,它让我抓狂。所以我想我会作弊并问一些知道的人(蠕变蠕变)。我如何转换:bin/hadoopjarhadoop*examples*.jarwordcountinput/somedataoutputOozie工作流?我假设它是一个