read_actions

hadoop - 如何在 Mahout in Action 中构建和执行示例

我现在正在学习MahoutinAction，并写信询问如何构建和执行书中的示例。我可以找到有关Eclipse的说明，但我的环境不包括UI。所以我把第一个例子(RecommenderIntro)复制到RecommenderIntro.java中，通过javac编译。我得到一个错误，因为包没有被导入。所以我正在寻找:导入缺失包的方法。我猜，即使编译成功，也会生成.class文件，我该如何执行它？通过“javaRecommnderIntro”？我可以执行通过sudo-uhdfshadoopjar的mahout示例mahout-examples-0.7-cdh4.2.0-job.jarorg.

建和何在 RecommenderIntro hadoop section compilation hbase mahout

java - Hadoop 在从 Spring 批处理管理员启 Action 业时获取连接被拒绝的异常

我正在尝试从springAdmin触发hadoopmapreduce作业，但出现以下错误。SpringAdmin在wasce上运行。作业配置:fs.defaultFS=hdfs://localhost:8020mapred.job.tracker=localhost:8021请指教。当我通过打包一个jar并使用hadoop命令运行此作业时，它工作正常但在通过Admin运行时出错。sudo-uhdfshadoopjartest.jarorg.MainCausedby:java.net.ConnectException:CallFrom/tolocalhost:8021failedonco

Hadoop Action java apache spring mapreduce spring-data

mysql - Hive 查询在启 Action 业并生成跟踪 URL 后不会开始 MapReduce 进程

我正在使用ApacheHive。我在Hive中创建了一个表(类似于外部表)并使用LOADDATALOCALINPATH'./Desktop/loc1/kv1.csv'OVERWRITEINTOTABLEadih;命令将数据加载到该表中。虽然我能够从配置单元表adih中检索简单数据(例如select*fromadih、selectc_codefromadihlimit1000等)，但Hive给了我当我请求涉及轻微计算的数据时出现错误(例如selectcount(*)fromadih、selectdistinct(c_code)fromadih)。Hivecli输出如下链接所示-hive>

MapReduce Action code strong section mysql hadoop hive hadoop-yarn

hadoop - 合流 HDFS 连接器 : How can I read from the latest offset when there are no hdfs files?

我们有一个运行了几天的生产者应用程序，它正在为topicA生产数据。我们想启动hdfs连接器以从topicA读取而不是从偏移量0读取(因为这将导致巨大的滞后)。我们想从最新偏移量开始(一直有新数据进入topicA)。1)由于连接器从hdfs中的主题名称获取偏移量信息，我们如何从最新的偏移量中读取，因为hdfs中不存在任何文件？2)我能想到的一个选项是为每个分区手动创建具有最新偏移量的虚拟文件，但我们在这里讨论的是topicA中的60个分区，所以有没有更优雅的方法来做到这一点？最佳答案 NoName，最近添加了HDFS连接器在HDF

合流 hadoop 偏移 section kafka-connect-hdfs apache-kafka hdfs apache-kafka-connect confluent-platform

hadoop - hadoop 是否需要运行 mahout-in-action 示例？

运行MahoutInAction示例需要hadoop吗？我看到有一个hadoopjar提供了mahout。我一直在使用build-reuters.sh时遇到问题，想知道是否需要单独安装hadoop。谢谢!! 最佳答案 MahoutinAction一书的大部分内容都涉及将ApacheMahout与ApacheHadoop结合使用。所以是的，您最终将需要Hadoop。本书指导您下载并安装Hadoop。Hadoop本身不随Mahout提供，不。但是Mahout的构建系统引用了Hadoop，因此它会自动下载Hadoop之类的依赖项。这是另一

hadoop mahout-in-action section Mahout

hadoop - 错误 : org. 找不到 apache.oozie.action.hadoop.PigMain

我正在尝试通过oozie工作流执行一个简单的pig脚本，该工作流导入一个pythonjar以及其他一些jar并最终得到如下错误:FailingOozieLauncher,Mainclass[org.apache.oozie.action.hadoop.PigMain],exceptioninvokingmain(),java.lang.ClassNotFoundException:Classorg.apache.oozie.action.hadoop.PigMainnotfoundjava.lang.RuntimeException:java.lang.ClassNotFoundExc

hadoop PigMain apache java apache-pig oozie

shell - 带有单引号的 Oozie Shell Action 参数被删除

我正在尝试通过一些子工作流配置来运行OozieShellAction作业。在编写配置文件(workflow.xml)时，我将一些变量(来自job.properties文件)用单引号括起来，如:myVar'${myVar}'但是，在Shell脚本中，接收到的参数没有有任何单引号？有什么想法吗？最佳答案尝试不加引号。我的变量${myVar} 关于shell-带有单引号的OozieShellAction参数被删除，我们在StackOverflow上找到一个类似的问题：

引号 Action section strong shell hadoop mapreduce oozie cloudera-cdh

shell - Oozie——java : command not found - shell action

我正在通过Oozie从shell脚本运行java程序，但出现以下错误java:commandnotfound当我从边缘节点运行shell脚本时，我没有发现任何问题，java类运行时没有任何错误，我也得到了所需的输出。但是，无法运行java命令的是oozie作业。oozie中的所有其他操作都正常执行，但是当它遇到java行时，它会抛出上述错误。我知道Hadoop集群中的所有节点都会安装Java，那么为什么会出现此错误？下面是我的shell脚本中的java命令......java-cp$LOCAL_DIR/libs/integration-tools.jarcom.audit.report

shell mdash section java hadoop oozie

Hadoop 作业失败 : Error Reading IndexFile?

如何解决这样的错误Mapoutputlost,rescheduling:getMapOutput(attempt_201204251959_0001_m_000000_0,0)failed:java.io.IOException:ErrorReadingIndexFileatorg.apache.hadoop.mapred.IndexCache.readIndexFileToCache(IndexCache.java:113)atorg.apache.hadoop.mapred.IndexCache.getIndexInformation(IndexCache.java:66)ator

IndexFile Reading java mortbay org hadoop mapreduce

windows - mapred.JobClient : Error reading task output http:. .. 在 Windows 操作系统上从 Cygwin 运行 hadoop 时

我在Windows上运行来自Cygwin的“MahoutinAction”一书中的“从文档生成向量”样本。Hadoop仅在本地计算机上启动。下面是我的运行命令:$bin/mahoutseq2sparse-ireuters-seqfiles/-oreuters-vectors-ow但是下面显示java.io.IOException，有谁知道这个问题是什么原因造成的？提前致谢!Runningonhadoop,usingHADOOP_HOME=my_hadoop_pathHADOOP_CONF_DIR=my_hadoop_conf_path13/05/1318:38:03WARNdriver

JobClient windows hadoop mapred INFO cygwin mahout

250 251 252253254 255 256