草庐IT

delete-cascade

全部标签

hadoop - 使用 Cascalog/Cascading 读取 XML

网上有一些信息表明Mahout的XMLInputFormat可用于在hadoop上有效地处理XML,但我一直无法找到如何使其工作的示例。有人可以指出我正确的方向吗?我正在使用Cascalog/Clojure。 最佳答案 看看这个使用记录阅读器的hadoop实现读取xml文件:http://javatute.com/javatute/faces/post/hadoop/2014/reading-simple-xml-file-using-hadoop.xhtml 关于hadoop-使用Ca

debugging - 如何使用 Cascading 获取 Hadoop 以显示调试日志输出?

我在获取Hadoop和Cascading时遇到问题1.2.6向我展示应该来自使用Debug的输出筛选。Cascadingguidesaysthisishowyoucanviewthecurrenttuples.我正在使用它来尝试查看任何调试输出:Debugdebug=newDebug(Debug.Output.STDOUT,true);debug.setPrintTupleEvery(1);debug.setPrintFieldsEvery(1);assembly=newEach(assembly,DebugLevel.VERBOSE,debug);我是Hadoop和Cascading

scala - 如何在hadoop中实现OR join(scalding/cascading)

只需将连接字段作为缩减键发送,就可以很容易地通过单键连接数据集。但是通过多个键连接记录(其中至少一个键应该相同)对我来说并不那么容易。示例我有日志,我想按用户参数对它们进行分组,我想通过(ipAddress,sessionId,visitorCockies)加入它们如果log1.ip==log2.ipORlog1.session=log2.sessionORlog1.cockie=log2.coockie,那么log1应该与log2分组。也许可以创建复合键或一些概率方法,如minHash...这可能吗? 最佳答案 问题是MapRed

scala - 压缩输出 Scalding/Cascading TsvCompressed

所以人们在压缩ScaldingJobs的输出时遇到了问题,包括我自己。谷歌搜索后,我在某个不起眼的论坛中得到了奇怪的答案,但没有适合人们复制和粘贴需求的答案。我想要像Tsv这样的输出,但写入压缩输出。 最佳答案 无论如何,经过大量的faffification我设法编写了一个似乎可以完成工作的TsvCompressed输出(您仍然需要设置hadoop作业系统配置属性,即将压缩设置为true,并将编解码器设置为合理的或默认为蹩脚的放气)importcom.twitter.scalding._importcascading.tuple.F

Hadoop Cascading - 创建一个源,两个汇的流

我正在使用Cascading2创建Hadoop作业,并尝试创建一个从单一来源开始的流程。在对数据应用几个函数后,我需要拆分流,以便使用此数据创建两个单独的报告(在两个单独的接收器中)。//SOURCESchemesourceScheme=newTextLine(newFields("line"));Tapsource=newHfs(sourceScheme,input);//REPORT1SINKSchemereport1SinkScheme=newTextDelimited(Fields.ALL,",","\"");Tapreport1Sink=newHfs(report1SinkS

bash - Hadoop 和 Bash : delete filenames matching range

假设您在HDFS中有一个文件列表,其中包含一个公共(public)前缀和一个递增的后缀。例如,part-1.gz,part-2.gz,part-3.gz,...,part-50.gz我只想在目录中留下几个文件,比如3个。任何三个文件都可以。这些文件将用于测试,因此文件的选择无关紧要。删除其他47个文件的最简单、最快的方法是什么? 最佳答案 这里有几个选项:手动将三个文件移至新文件夹,然后删除旧文件夹。使用fs-ls获取文件名,然后拉出前n个,然后rm它们。在我看来,这是最可靠的方法。hadoopfs-ls/path/to/files

hadoop - 工作流工具比较 : Oozie Vs Cascading

我正在寻找一种工作流工具来运行复杂的map-reduce作业。我想到了Oozie,但也想探索Cascading。是否有使用级联API链接现有M/R作业的示例代码或示例?另外,您能否提供Oozie与Cascading的比较? 最佳答案 Cascading和Oozie不属于同一范畴。Oozie是一个工作流调度器。Cascading是一种用于创建工作流的API。它与调度程序无关,即它应该与您使用的任何调度程序系统一起运行。可能存在一些混淆,因为Oozie文档提到了“DAG”,并且两者都运行在Hadoop之上。此外,Cascading在检查

php - 警告 : ftp_get(): Delete operation successful

我有一些代码可以从我们的开发服务器传输备份,它似乎随机地表现得很奇怪并给出以下错误/输出:Warning:ftp_get():Deleteoperationsuccessful.in/root/cron/get_dev_archives.phponline106ERRblahjob:Failedtogetfile:2013-09-25_18-22-04-blahjob_dev18.tgzPHPWarning:ftp_get():Deleteoperationsuccessful.in/root/cron/get_dev_archives.phponline106Warning:ftp_

mysql - 如何在表上添加 ON DELETE 约束?

如何在表上添加ONDELETE约束? 最佳答案 使用ALTERTABLE+添加约束。例如。如果您想通过member_id链接表成员和配置文件,并在每次删除成员时级联删除配置文件,您可以编写如下内容:ALTERTABLEprofilesADDCONSTRAINT`fk_test`FOREIGNKEY(`member_id`)REFERENCES`members`(`member_id`)ONDELETECASCADE如果您需要更新该约束-您必须在重新创建时删除它,没有直接的方法可以更改它。ALTERTABLEprofilesDROPF

mysql - 如何在表上添加 ON DELETE 约束?

如何在表上添加ONDELETE约束? 最佳答案 使用ALTERTABLE+添加约束。例如。如果您想通过member_id链接表成员和配置文件,并在每次删除成员时级联删除配置文件,您可以编写如下内容:ALTERTABLEprofilesADDCONSTRAINT`fk_test`FOREIGNKEY(`member_id`)REFERENCES`members`(`member_id`)ONDELETECASCADE如果您需要更新该约束-您必须在重新创建时删除它,没有直接的方法可以更改它。ALTERTABLEprofilesDROPF