草庐IT

read_actions

全部标签

Hadoop 0.2 : How to read outputs from TextOutputFormat?

我的reducer类使用TextOutputFormat(Job给出的默认OutputFormat)生成输出。我喜欢在MapReduce作业完成后使用此输出来聚合输出。除此之外,我喜欢用TextInputFormat写出聚合信息,以便MapReduce任务的下一次迭代可以使用此过程的输出。谁能给我一个关于如何使用TextFormat进行书写和阅读的示例?顺便说一句,我使用TextFormat而不是Sequence的原因是互操作性。任何软件都应该使用输出。 最佳答案 暂时不要排除序列文件;它们使链接MapReduce作业变得快速和容易

Hadoop 作业客户端 : Error Reading task output

我正在尝试在我的集群上处理40GB的维基百科英文文章。问题是以下重复错误消息:13/04/2717:11:52INFOmapred.JobClient:TaskId:attempt_201304271659_0003_m_000046_0,Status:FAILEDToomanyfetch-failures13/04/2717:11:52WARNmapred.JobClient:Errorreadingtaskoutputhttp://ubuntu:50060/tasklog?plaintext=true&attemptid=attempt_201304271659_0003_m_00

hadoop - 亚马逊 EC2 和 S3 : How to read and write data

我刚刚遵循了本指南:http://rogueleaderr.tumblr.com/post/32768181371/set-up-and-run-a-fully-distributed-hadoop-hbase-cluster在运行hadoop和hbase的AmazonEC2上设置集群。我现在想知道的是,我实际上如何在我的集群上运行的hbase中获取我的数据?我需要将它加载到S3中然后加载到我的hbase集群中吗?是否有加载/提取数据的最佳实践?由于我是EC2的新手,因此我将不胜感激。 最佳答案 您需要通过SSH连接到您的一个节点,

hadoop - 如何使用 oozie.launcher.action.main.class 将参数传递给 Oozie 操作?

Oozie有一个名为oozie.launcher.action.main.class的配置属性,您可以在其中为map-reduce操作(或shell操作)传入“主类”的名称,如下所示:oozie.launcher.action.main.classcom.company.MyCascadingClass但是我需要将参数传递给我的主类,但找不到实现它的方法。有什么想法吗?我问这个问题是因为我正尝试从Oozie中启动一个级联类/流,但到目前为止我尝试过的所有选项都失败了。如果有人从Oozie获得了Cascading功能,请告诉我,我会发布另一个问题来特别询问这个问题。

hadoop - Kafka Spark 流式传输 : unable to read messages

我正在使用spark-streaming集成Kafka和Spark。我作为kafka生产者创建了一个主题:bin/kafka-topics.sh--create--zookeeperlocalhost:2181--replication-factor1--partitions1--topictest我在kafka中发布消息并尝试使用spark-streamingjava代码读取它们并将它们显示在屏幕上。守护进程全部启动:Spark-master,worker;动物园管理员;卡夫卡。我正在使用KafkaUtils.createStream编写一个Java代码来完成它代码如下:public

java - Parquet .io.ParquetDecodingException : Can not read value at 0 in block -1 in file

我已经使用saveAsTable方法在Hive中保存了一个远程数据库表,现在当我尝试使用CLI命令select*fromtable_name访问Hive表数据时,它给出了我的错误如下:2016-06-1510:49:36,866WARN[HiveServer2-Handler-Pool:Thread-96]:thrift.ThriftCLIService(ThriftCLIService.java:FetchResults(681))-Errorfetchingresults:org.apache.hive.service.cli.HiveSQLException:java.io.IO

hadoop - 是否值得购买 Mahout in Action 以跟上 Mahout 的速度,或者是否有其他更好的来源?

我目前是ApacheMahout的一个非常随意的用户,我正在考虑购买这本书MahoutinAction.不幸的是,我真的很难了解这本书的值(value)——并且看到它是ManningEarlyAccessProgram书(因此目前仅作为测试版电子书提供),我无法亲自去书店看书。任何人都可以推荐这个作为快速了解Mahout和/或可以补充Mahout网站的其他来源的好(或不太好)指南吗? 最佳答案 作为Mahout的提交者和本书的合著者,我认为这是值得的。;-)但是说真的,你在做什么?也许我们可以为您指出一些资源。Mahout的某些方面

php - 检查是否定义了 Laravel Controller Action

我有一个应用程序,我将在其中将链接存储在数据库中,允许用户为链接分配操作。我想避免操作不存在而出现此错误的情况;ActionApp\Http\Controllers\PermissionController@index2notdefined.所以我想检查一个Action是否存在并且有路由。如果可能在Blade中,但其他任何地方都可以。 最佳答案 没有任何内置方法可以做到这一点。但是我们有一个action辅助方法,它根据ControllerAction生成路由url。我们可以利用它并创建一个简单的辅助函数来实现相同的结果。该方法还会检

php - Magento 默认 Controller Action

如何为每个Action创建一个函数?例如我有功能:publicfunctionindexAction(){$this->loadLayout();$this->renderLayout();}但这是针对Action索引的,但是当我不知道Action或其动态创建时怎么办,例如Action可以是controller/someaction,controller/someaction2我想创建默认函数来处理这个问题 最佳答案 我个人会这样做:1-我会像这样创建一个继承自Zend_Controller_Action的抽象类:loadLayou

javascript - Select2.js 错误 : Cannot read property 'length' of undefined

我正在使用Select2jquery插件,但无法使用json获取结果。在浏览器中查看json响应时,它看起来没问题。例如:[{"id":"50","family":"Portulacaceae"},{"id":"76","family":"Styracaceae"},{"id":"137","family":"Dipsacaceae"}]在这种情况下使用ajax调用的URL是:http://localhost/webpage/json_family.php?term=acac&_=1417999511783但我无法在select2输入中得到结果,控制台说:UncaughtTypeErr