草庐IT

myapplication-application-context

全部标签

web-applications - 使用 mapreduce 编程的 Web 应用程序中的图形(折线图、饼图)

你好friend,我正在开发一个web应用程序,我需要编写一个mapreduce代码来处理来自Hadoop分布式文件系统的数据,并在reducer输出的基础上绘制各种图形,所以我在eclipse中用Java开发应用程序,所以我怎样才能做到这一点? 最佳答案 我建议您尝试使用配置单元。在包含reducer文件输出的ehive表上创建。使用JDBC或ODBC连接将数据从配置单元拉到您的前端,并使用您的图形表示形式(如饼图)。 关于web-applications-使用mapreduce编程的

api - 纱 API : Getting Yarn Aggregated Logs for application by API

我使用YARNjavaAPI而不是在终端中提交Hadoop应用程序。我正在寻找一种在应用程序完成后通过YarnAPI获取yarn聚合日志的方法。当然,这可以通过简单的命令来完成:“yarnlogs-applicationId{my_application_ID}”,但我想通过API来完成。有人知道如何使用API而不是命令行来获取这些日志吗?谢谢。 最佳答案 正如您在代码源上所做的那样https://github.com/apache/hadoop/blob/trunk/hadoop-yarn-project/hadoop-yarn/

hadoop yarn : show the pending resoure request of an application

如何获取应用程序发送给资源管理器的待处理请求数?据我所知,资源管理器可能不会立即分配请求的资源,因此请求将被挂起,对吧? 最佳答案 我正在使用Hadoop2.7.1。从资源管理器UI中,您可以看到“未完成的资源请求”。在RM用户界面中:点击正在运行的应用程序(例如application_1447644421851_0004)在申请页面中,点击尝试ID(例如appattempt_1447644421851_0004_000001)在“应用程序尝试ID”页面中,您将看到“TotalAllocatedContainers”和“TotalO

Apache 纳奇 : Get outlink URL's text context

任何人都知道一种提取包含外链URL的文本上下文的有效方法。例如,假设此示例文本包含一个外链:Nutchcanrunonasinglemachine,butgainsalotofitsstrengthfromrunninginaHadoopcluster.YoucandownloadNutchhere.FormoreinformationaboutApacheNutch,pleaseseetheNutchwiki.在这个例子中,我想获取包含链接的句子,以及该句子前后的句子。有什么办法可以有效地做到这一点?我可以调用任何方法来获取诸如链接在已获取内容中的位置之类的信息吗?或者甚至是我可以修

hadoop - YARN Application Master 无法连接到 Resource Manager

我有一个4节点集群(1个名称节点/资源管理器3个数据节点/节点管理器)我正在尝试运行一个简单的tez示例orderedWordCounthadoopjarC:\HDP\tez-0.4.0.2.1.1.0-1621\tez-mapreduce-examples-0.4.0.2.1.1.0-1621.jarorderedwordcountsample/test.txt/sample/out作业被接受,Applicationmaster和容器被设置但是在节点管理器上我看到了这些日志2014-09-1017:53:31,982INFO[ServiceThread:org.apache.tez.

斯卡拉/Hadoop : Specifying Context for Reducer

在开始使用Scoobi或Scrunch之前,我想我应该尝试仅使用Hadoop(0.20.1)的java绑定(bind)将WordCount移植到scala(2.9.1)。最初,我有:classMapextendsMapper[LongWritable,Text,Text,IntWritable]{@throws[classOf[IOException]]@throws[classOf[InterruptedException]]defmap(key:LongWritable,value:Text,context:Context){//...编译正常,但给了我一个运行时错误:java.i

hadoop - YARN : Application failed 2 times due to AM Container 上的 Spark 1.3.0

当使用以下脚本在YARN(Hadoop2.6.0.2.2.0.0-2041)上运行Spark1.3.0Pi示例时:#RunonaYARNclusterexportHADOOP_CONF_DIR=/etc/hadoop/conf/var/home2/test/spark/bin/spark-submit\--classorg.apache.spark.examples.SparkPi\--masteryarn-cluster\--executor-memory3G\--num-executors50\/var/home2/test/spark/lib/spark-examples-1.3

apache-spark - Spark Driver 内存和 Application Master 内存

我是否正确理解了客户端模式的文档?客户端模式与驱动程序在应用程序主机中运行的集群模式相反?在客户端模式下,driver和applicationmaster是独立的进程,因此spark.driver.memory+spark.yarn.am.memory必须小于机器的内存?在客户端模式下,驱动程序内存是否未包含在应用程序主内存设置中? 最佳答案 clientmodeisopposedtoclustermodewherethedriverrunswithintheapplicationmaster?是,当Spark应用程序部署在YARN

php - 使用适用于 PHP 的 AWS 开发工具包上传的 Amazon S3 文件始终为 “application/octet-stream”?

根据docs,contentType是可选的,它将尝试根据文件扩展名确定正确的mime类型。但是,它似乎从不猜测mime类型,并且始终默认为application/octet-stream这是我的代码:$s3=newAmazonS3();$opt=array('fileUpload'=>$_FILES['file']['tmp_name'],'storage'=>Amazons3::STORAGE_REDUCED);$r=$s3->create_object('mybucket',$_FILES['file']['name'],$opt);这是我的AWS控制台的屏幕截图:你如何在不设置

php - OOP 设计 : How to incorporate DB handling into application objects

这是我经常遇到的设计问题,我想找到一些关于这个主题的一般见解。这里提供的代码只是一个例子。在设计阶段很容易决定您需要一个对象:User==========UniqueIDLoginnamePasswordFullname并且很容易将其转换为数据库对象:CREATETABLEuser(user_idINTNOTNULLPRIMARYKEY,usernameVARCHAR(15)NOTNULLUNIQUE,password_hashCHAR(32)NOTNULL,full_nameVARCHAR(50));我的疑虑始于PHP级别。明显的转换是:但是,我应该如何填写实际值呢?我可以让类与数据