草庐IT

cascading

全部标签

java - 安装Github Project Cascading/vagrant-cascading-hadoop-cluster 出错

我开始安装vagrant-cascading-hadoop-clustergithub项目,但是出现了一些错误,无法结束安装。当我做“vagrantup”时sina@linux:/media/sina/passport/vagrant-cascading-hadoop-cluster$sudovagrantupBringingmachine'hadoop1'upwith'virtualbox'provider...Bringingmachine'hadoop2'upwith'virtualbox'provider...Bringingmachine'hadoop3'upwith'vir

hadoop - Hive 和 Cascading Lingual 之间有什么区别

Cascading为ApacheHadoop提供了一个ANSISQL接口(interface)(Lingual),lingual使用级联Planer来运行查询。这个Lingual与Hive有何不同(在哪些方面)?lingual相对于hive有什么优势? 最佳答案 近来有许多努力将SQL引入Hadoop。Hive和Lingual是两个,但还有Impala、Hawq、Drill、Tajo、BigSQL、Presto等。其中每一个都有一些最适合的场景。Lingual建立在级联之上,因此它的一个优势是它可以在其他平台上工作,而不仅仅是had

hadoop - 使用 Cascalog/Cascading 读取 XML

网上有一些信息表明Mahout的XMLInputFormat可用于在hadoop上有效地处理XML,但我一直无法找到如何使其工作的示例。有人可以指出我正确的方向吗?我正在使用Cascalog/Clojure。 最佳答案 看看这个使用记录阅读器的hadoop实现读取xml文件:http://javatute.com/javatute/faces/post/hadoop/2014/reading-simple-xml-file-using-hadoop.xhtml 关于hadoop-使用Ca

debugging - 如何使用 Cascading 获取 Hadoop 以显示调试日志输出?

我在获取Hadoop和Cascading时遇到问题1.2.6向我展示应该来自使用Debug的输出筛选。Cascadingguidesaysthisishowyoucanviewthecurrenttuples.我正在使用它来尝试查看任何调试输出:Debugdebug=newDebug(Debug.Output.STDOUT,true);debug.setPrintTupleEvery(1);debug.setPrintFieldsEvery(1);assembly=newEach(assembly,DebugLevel.VERBOSE,debug);我是Hadoop和Cascading

scala - 如何在hadoop中实现OR join(scalding/cascading)

只需将连接字段作为缩减键发送,就可以很容易地通过单键连接数据集。但是通过多个键连接记录(其中至少一个键应该相同)对我来说并不那么容易。示例我有日志,我想按用户参数对它们进行分组,我想通过(ipAddress,sessionId,visitorCockies)加入它们如果log1.ip==log2.ipORlog1.session=log2.sessionORlog1.cockie=log2.coockie,那么log1应该与log2分组。也许可以创建复合键或一些概率方法,如minHash...这可能吗? 最佳答案 问题是MapRed

scala - 压缩输出 Scalding/Cascading TsvCompressed

所以人们在压缩ScaldingJobs的输出时遇到了问题,包括我自己。谷歌搜索后,我在某个不起眼的论坛中得到了奇怪的答案,但没有适合人们复制和粘贴需求的答案。我想要像Tsv这样的输出,但写入压缩输出。 最佳答案 无论如何,经过大量的faffification我设法编写了一个似乎可以完成工作的TsvCompressed输出(您仍然需要设置hadoop作业系统配置属性,即将压缩设置为true,并将编解码器设置为合理的或默认为蹩脚的放气)importcom.twitter.scalding._importcascading.tuple.F

Hadoop Cascading - 创建一个源,两个汇的流

我正在使用Cascading2创建Hadoop作业,并尝试创建一个从单一来源开始的流程。在对数据应用几个函数后,我需要拆分流,以便使用此数据创建两个单独的报告(在两个单独的接收器中)。//SOURCESchemesourceScheme=newTextLine(newFields("line"));Tapsource=newHfs(sourceScheme,input);//REPORT1SINKSchemereport1SinkScheme=newTextDelimited(Fields.ALL,",","\"");Tapreport1Sink=newHfs(report1SinkS

hadoop - 工作流工具比较 : Oozie Vs Cascading

我正在寻找一种工作流工具来运行复杂的map-reduce作业。我想到了Oozie,但也想探索Cascading。是否有使用级联API链接现有M/R作业的示例代码或示例?另外,您能否提供Oozie与Cascading的比较? 最佳答案 Cascading和Oozie不属于同一范畴。Oozie是一个工作流调度器。Cascading是一种用于创建工作流的API。它与调度程序无关,即它应该与您使用的任何调度程序系统一起运行。可能存在一些混淆,因为Oozie文档提到了“DAG”,并且两者都运行在Hadoop之上。此外,Cascading在检查

php - ORM Doctrine ManyToOne 更新 CASCADE (Symfony)

我有两个实体classPromotor{/***@ORM\ManyToOne(targetEntity="Ciudad",inversedBy="promotor")*@ORM\JoinColumn(name="ciudad_id",referencedColumnName="id",nullable=false)*/protected$ciudad;和classCiudad{/***@varinteger**@ORM\Column(name="id",type="integer")*@ORM\Id*@ORM\GeneratedValue(strategy="AUTO")*/priva

android - Android 版 OpenCV : failed to load cascade classifier error

这是我第一次使用openCV库。我想用它来检测眼睛。我使用了本教程中提供的FdActivity代码:http://romanhosek.cz/android-eye-detection-updated-for-opencv-2-4-6/本教程使用OpenCV2.4.6,但我在我的项目中下载了3.1版本。由于版本差异,我已将使用putText、矩形和圆形的行更改为从imgproc而不是Core导入。这就是我所改变的。我已将haarcascade_lefteye_2splits.xml和lbpcascade_frontalface.xml添加到res文件夹下的raw文件夹中。运行应用程序时