草庐IT

决策树的剪枝

全部标签

shell - 如何在 OOZIE 决策节点中使用逻辑运算符?

我有第一个要求,我必须检查文件是否存在于给定的HDFS位置。如果文件存在,我必须测试文件的大小是否大于200字节。根据这两个结果,我必须向用户发送电子邮件通知。我可以借助下面的代码检查文件是否存在${fs:exists("/user/cloudera/trdat/test.txt")}我可以借助下面的代码检查文件大小${fs:fileSize("/user/cloudera/trdat/test.txt")gt200*B}我必须创建一个工作流程来检查文件是否存在,如果不存在,则发送电子邮件通知“文件不存在”,就像向用户发送该消息一样。如果存在,那么我们必须检查文件大小是否大于200字节

hadoop - 在 Hadoop 上并行化执行决策树 ID3/C4.5

我想在Hadoop上实现决策树ID3/C4.5。任何人都可以知道如何继续。我很清楚这些算法,但我需要知道如何并行化它们。 最佳答案 我会考虑将属性选择的一次迭代作为一项MapReduce作业的方法。按照这个想法,您可以将属性分配给每个映射器以检查信息增益,并且在减少阶段(使用单个减少器)您可以选择最佳属性。如果在一台机器上(在所有属性上)计算单次迭代的时间比作业开始的开销稍长——大约20-40秒,我会认为这种方法是可行的。 关于hadoop-在Hadoop上并行化执行决策树ID3/C4.

java - Apache Hama 适合做决策树吗?

我目前已经在Hadoop中实现,Hadoop是Google用于构建决策树的框架(也称为PLANET)。它从单个顶点开始,随着map减少作业,您会添加越来越多的作业,直到完全构建树。一个主要问题是许多map/reduce作业一个接一个地运行,因此一直开始新作业的成本非常高。我看过很多次,ApacheHama适合做图这样的迭代算法。有人可以用Hama构建一个新图,或者你只是输入一个图并对其进行一些计算吗?将我的项目转移到Hama会容易吗?谢谢 最佳答案 Hama确实能够使用PLANET论文中描述的算法以比MapReduce更有效的方式构

r - 如何在 R 中绘制基于规则的决策树

我刚开始使用R,但我很难在R中绘制基于规则的决策树。问题是,我已经有一个来自hadoopMapReduce的输出,它是一个简单文本文件的形式。现在我想使用Hadoop的这个输出并在R上以图形方式表示它。输出文件看起来像这样。1overcastyes1rain3strongno1rain3weakyes1sunny2highno1sunny2normalyes有没有一种方法可以在R中以图形方式表示,例如,http://web.cs.swarthmore.edu/~meeden/cs63/f05/figure3.1.jpg任何帮助将不胜感激。谢谢 最佳答案

php - 如何用php获取所有可能的决策树

我希望用php构建所有可能的决策树。我正在寻找的正是thisanswer,但是,我在php中需要它,而且我很难解释LINQ;stringbuilder可能需要是一个数组。 最佳答案 这是一个PHP版本,它返回由数组形成的树的集合。functionAllBinaryTrees($size=0){//emptytree,size=0if($size===0){returnarray(null);}//otherwisetake1fromthesizefortherootofthecurrentsubtreeand//splitthere

android - Android 上简单游戏的设计决策/建议

我需要您的建议,了解在简单游戏中实现可滚动运动场的最佳方式。该字段由多行组成,每行有9个单元格。行可以在游戏过程中动态添加和删除。每个单元格中都有一个数字,并且可以选择几个叠加的图像,如选择、选择器覆盖、划掉等(见下图)。用户应该能够单击一行中的各个单元格以选择/取消选择/交叉触摸的单元格。在游戏中的任何时候都可以有0到3000个单元格(0到大约333行)。该字段应顺畅地上下滚动。我正在考虑拥有一个ListView,其中每一行都是字段中的一行。这样我就可以在游戏过程中动态添加/删除行。但是,我究竟应该如何实现一行:用一个位图表示一行,然后当用户触摸它时——获取触摸区域的坐标,找出受影响

【算法系列】时间复杂度、深搜(连通性、剪枝)、宽搜、Flood Fill、图论

目录时间复杂度介绍前言一、深搜1.1深搜思想1.2基础题目1.2.1排列数字1.2.2n-皇后问题1.3DFS中的连通性(能走到,不能保证最短)DFS、BFS均可以求解1.3.1迷宫1.3.2红与黑1.4DFS中的搜索顺序1.4.1马走日1.4.2单词接龙1.4.3分成互质组(待补充)1.5DFS剪枝1.5.1小猫爬山1.5.2数独二、宽搜2.0宽搜模板2.1宽搜类型2.2基础题目2.2.1献给阿尔吉侬的花束2.2.2走迷宫2.2.3八数码2.2.4地牢大师2.3FloodFill2.3.1池塘计数2.3.2城堡问题2.3.3山峰和山谷2.4最短路模型2.4.1迷宫问题2.4.2武士风度的牛2

c++ - A* 跳跃点搜索——剪枝是如何真正起作用的?

我遇到了JumpPointSearch,这对我来说似乎很甜蜜。但是,我不确定他们的修剪规则实际上是如何工作的。更具体地说,在图1中,它声明wecanimmediatelypruneallgreyneighboursasthesecanbereachedoptimallyfromtheparentofxwithoutevergoingthroughnodex然而,这似乎有些矛盾。在第二张图片中,可以通过首先通过节点7并完全通过对称路径跳过x来到达节点5-也就是说,6->x->5似乎与6->7->5对称。这与不通过第一张图片中的x即可到达节点3的方式相同。因此,我不明白这两个图像为何不完全

c++ - 当参数是重载函数时,重载决策如何工作?

序言C++中的重载解析可能是一个过于复杂的过程。要理解管理重载解析的所有C++规则,需要付出相当多的脑力劳动。最近我想到参数列表中重载函数名称的存在会增加重载解析的复杂性。由于恰好是一个广泛使用的案例,我发布了aquestion并收到了一个答案,使我能够更好地理解该过程的机制。但是,在iostream的上下文中提出该问题似乎在某种程度上分散了答案的重点,使其偏离了所解决问题的本质。因此,我开始更深入地研究,并提出了其他示例,要求对问题进行更详尽的分析。这个问题是一个介绍性问题,后面是一个moresophisticatedone。.问题假设一个人完全理解在没有参数的情况下重载决议是如何工

从模板实例化后声明的模板函数选择候选者调用的 C++ 模板重载决策

这是一个极简主义的例子,来自模板上下文的一个非常奇怪的重载决议:#include//Types//structI{intv;};templatestructD{Tt;};//Functions////Overload1templateIf(T){return{1};}//Templateindirectionthatcallsf(T)templateIg(D){returnf(T{});}//Nontemplateindirectionthatcallsf(T)Ih(D){returnf(I{});}intmain(){std::coutoverload1called{}).v//f(