REST-ful

rest - 在hadoop中，通过knox + webhdfs可以访问的数据大小有限制吗？

在hadoop中，对于可以通过knox+webhdfs访问/摄取到HDFS的数据大小是否有任何限制？最佳答案当您需要从受防火墙保护的集群外部访问webhdfs资源时，ApacheKnox是您的最佳选择。如果您无权访问所有数据节点端口，那么直接访问webhdfs将不适合您。为所有这些主机打开防火墙漏洞:端口破坏了防火墙的目的，引入了管理噩梦并不必要地向外部客户端泄露了网络详细信息。正如Hellmar所指出的，这取决于您的具体用例和客户。如果您需要摄取大文件或大量文件，那么您可能需要考虑使用不同的方法来为这些客户端访问集群内部。如果

spring - 使用 Apache Knox 网关自定义基于 spring 的 rest API

我正在尝试做一个POC，我需要通过ApacheKnox保护我的集群，而我自己开发的restAPI将位于Knox后面。用户身份验证应如何与KnoxRanger配合使用，我将如何保护我的数据访问？最佳答案让我们从service.xml文件开始。它应该看起来像下面的更简单的版本。如果您需要将特定规则应用于请求或响应的特定部分，则只需要更复杂的表单。请注意，理想情况下只需要一条路线，但**在Knox中表示一个或多个路径级别(不是零个或多个)。因此，如果没有第一条路线，Knox将不会向服务的根/Test_Web_App路径发送请求。如果您

自定 spring 34 Test_Web_App code hadoop spring-security hortonworks-data-platform

带有 Hadoop HBASE 的 Spring Boot REST

我希望构建一个简单的RESTFullAPI来访问HBase。我查看了PythonHappyBase，但我的集群是基于Kerberos的。现在我进入了Spring。我曾经使用SolrCloud和SpringBoot制作简单的APIREST。是否可以对Hbase做同样的事情？我不知道是否必须使用SpringBoot'YarnApp'=>https://spring.io/guides/gs/yarn-basic/或SpringHadoop。=>https://projects.spring.io/spring-hadoop/只需要一个非常简单的API。感谢您的帮助。

Hadoop Spring springframework strong spring-boot hbase

rest - 通过 rest api 运行 MapReduce 作业

我使用hadoop2.7.1的restapi在集群外运行mapreduce作业。这个例子“http://hadoop-forum.org/forum/general-hadoop-discussion/miscellaneous/2136-how-can-i-run-mapreduce-job-by-rest-api”真的帮助了我。但是当我提交帖子回复时，一些奇怪的事情发生了:我查看“http://master:8088/cluster/apps”，帖子响应产生两个作业，如下图所示:strangethings:aresponseproducestwojobs等待很长时间后，我在http

rest MapReduce 34 hadoop section hadoop-yarn

hadoop - 使用 rest API 创建 Apache kylin cube

我试图使用带有多维数据集定义的json文件的restapi从头开始创建多维数据集，我尝试对restapi执行curl命令，但似乎不起作用，我尝试使用他们的kylin客户端工具，但甚至失败了创建一个多维数据集，所以我想知道是否可以从restapi创建一个项目、模型和多维数据集？curl-b/home/raghu/cookiefile.txt-XPUT-H'Accept:application/json'-H'Content-Type:application/json;charset=UTF-8'-data@/home/raghu/cube_def.jsonhttp://1.1.1.1

hadoop Apache 多维 section rest olap kylin

rest - 如何通过HBase REST服务获取Phoenix表数据

我在以下代码片段中使用PhoenixJDBC驱动程序创建了一个HBase表:Class.forName("org.apache.phoenix.jdbc.PhoenixDriver");Connectionconn=DriverManager.getConnection("jdbc:phoenix:serverurl:/hbase-unsecure");System.out.println("gotconnection");conn.createStatement().execute("CREATETABLEIFNOTEXISTSphoenixtest(idBIGINTnotnullp

Phoenix HBase section 34 rest hadoop jdbc apache-phoenix

hadoop - 将数据从 Rest API 加载到 HDFS

我有一个restapi的URLexample:`www./?apikey=1344&host=microsoft.com&records=10`example:`www./?apikey=1344&host=timesofindia.com&records=10`参数可以改变我从另一个文件中获取这些参数，该文件也是JSON格式["microsoft.com","cde.com","timesofindia.com"]我可以使用flume加载这些数据吗，如果可以，请告知可以使用哪种源类型以及如何使用。如果不是，请建议替代方案。最佳答案

hadoop Rest section com code flume

java - 通过 REST API : allocatedMB, allocatedVcores 和 runningContainers 的 Hadoop 指标始终为 -1

我们尝试报告每个用户的每月hadoop应用程序指标，并使用以下RESTAPI路径使用RESTAPI:http://[host:port]/ws/v1/cluster/app除了始终为-1的allocatedMB、allocatedVcores和runningContainers之外，返回的数据看起来不错。谁能解释一下这是为什么？最佳答案如果调用RM集群应用程序API时您的集群上没有正在运行的作业，您正在查看历史数据。基于Hadoop代码(hadoop-yarn-project/下的QueueStatisticsPBImpl.ja

runningContainers allocatedVcores section hadoop code java rest

rest - 建议的基于 Hadoop 的设计/组件以获取定期 REST API 调用

我们计划使用RESTAPI调用从端点提取数据并将数据存储到HDFS。REST调用以周期性方式(每天或可能每小时)完成。我已经使用Flume完成了Twitter摄取，但我认为使用Flume不适合我当前的用例，因为我没有使用像Twitter中这样的连续数据流，而是离散的定期时间限制调用。我现在的想法是使用自定义Java来处理RESTAPI调用并保存到HDFS，然后在该Javajar上使用Oozie协调器。我想听听关于设计以及将哪个基于Hadoop的组件用于此用例的建议/替代方案(如果有比我现在想的更简单的话)。如果你觉得我可以坚持使用Flume，那么也请告诉我如何做到这一点。

Hadoop rest Flume section noreferrer data-ingestion

rest - Yarn 使用 rest API 获取日志

在Hadoop2中，是否可以使用restAPI获得与以下相同的结果:yarnlogs-applicationId 最佳答案这很痛苦，我没有满意的答案，但我可以为您指出一些资源。YARNCLI通过转到filesystem转储日志.如果您的应用程序可以访问HDFS，它也可以做同样的事情(但这并不简单)。或者，您可以使用rest调用http:///ws/v1/cluster/apps/{appid}获取应用程序主日志URL(但不是日志内容).从此URL中，您可以获取包含日志内容的HTML页面，该页面将在中返回。带有编码HTML实体的标签

rest Yarn hadoop section hadoop-yarn

164 165 166167168 169 170