nvidia-container-cli

jdbc - Hive JDBC 与 CLI 客户端

我需要使用Hive以编程方式访问数据(数据按每次查询GB的顺序排列)。我正在评估CLI驱动程序与HiveJDBC驱动程序。当我们使用JDBC时，thrift服务器会产生额外的开销，我想了解它有多大。如果多个客户端连接到单个节俭服务器，它也会成为单点瓶颈吗？或者人们在Hadoop上配置多个节俭服务器并做一些负载平衡是一种常见的做法吗？我正在寻找更好的性能而不是更快的原型(prototype)制作。提前致谢。最佳答案 Shengjie的链接不起作用-这可能会正确地自动链接:http://blog.milford.io/2011/07/

java - hadoop 日志中的 "complete event for unknown container id"是什么意思？

我正在尝试对集群中的多个文件运行一个简单的作业(wordcount示例)，但大多数map都失败了。当我引用任务日志时，我只看到这样的错误:ERROR[RMCommunicatorAllocator]org.apache.hadoop.mapreduce.v2.app.rm.RMContainerAllocator:Containercompleteeventforunknowncontaineridcontainer_1388066512888_0001_01_000026有什么想法吗？更新:我多次检查作业，有时由于map故障而失败，有时由于减少故障而在极少数情况下成功完成。但在任何情

amp container section code java hadoop mapreduce

hadoop - Apache Apex CLI 命令中 Shutdown-app 和 kill-app 的区别

谁能帮我理解，ApacheAPEXCLI命令中的Shutdown-app和kill-app有什么区别？最佳答案 Shutdown-app会调用各个Operator的tearDown()方法并等待一段时间让Operator正常关闭。然而，kill-app对所有运算符(operator)来说就像force-kill。因此，这将立即停止应用程序。但是，运营商不会有任何机会进行清理事件。在这两种情况下，YARN都会在应用关闭后释放分配给该应用的资源。关于hadoop-ApacheApexCL

Shutdown-app app section hadoop hadoop-yarn stream-processing apache-apex bigdata

hadoop - 如何从配置单元 cli 运行配置单元脚本

我现在有配置单元脚本custsales.hql，我想从配置单元cli运行它hive(pract5)>run/user/training/hdfs_location/custsales.hql但它不执行。请指导。我知道我们可以从命令行运行它$hive-f/home/training/local_location/custsales.hql但这不是我的要求。最佳答案使用sourcepath/to/script命令。关于hadoop-如何从配置单元cli运行配置单元脚本，我们在Stack

配置单 hadoop section code hive hivecli

hadoop - Hive CLI '-e' 和 '-f' 选项不起作用

我正在使用Horton-worksHadoop解决方案，但无法执行配置单元命令行界面命令。使用-e选项，命令如下C:\somepath\hive-0.11\bin>hive-e'select*fromsampletable'在这里，我得到了错误'ParseException',cannotrecognizeinputnear'',''inselectclause.使用-f选项，命令如下C:\somepath\hive-0.11\bin>hive-f/user/myusername/sample.sql这里报错unabletoreadthefileatspecifiedlocation.

amp 39 section code blockquote hadoop hive hortonworks-data-platform

hadoop - Hive CLI 如何从 HDFS 中检索巨大的结果文件？

在我通过CLI执行配置单元查询后，如下所示:$hive-eQUERY>output.txtHive客户端将编译QUERY并将其发送到Hadoop集群。Hadoop执行一些作业并将结果输出到文件(假设仅1个reducer)在HDFS。然后Hive客户端将检索这个单个文件，提取它，并输出到本地STDOUT。流程如下图所示:==============HadoopCluster==============|||||2.outputRESULTasasingle.gzfileatHDFSbecauseof1reducer||||1.QUERY||||3.HiveretrievestheRESU

hadoop Hive section code beeline

django - 启动 Hue Server，CLI 显示 8000，配置显示 8888，实际上是 : Nothing

我已经启动了一个在EC2实例上运行的Hue服务器，该实例具有HDFS的伪分布式设置。当我启动服务器时，CLI指出服务器正在localhost:8000上运行:0errorsfoundDjangoversion1.6.10,usingsettings'desktop.settings'Startingdevelopmentserverathttp://127.0.0.1:8000/QuittheserverwithCONTROL-C.但是，配置告诉它在localhost:8888上启动:###hue.inisample#Webserverlistensonthisaddressandpo

Nothing django code section 8000 hadoop amazon-ec2 hdfs hue

hadoop - 为什么通过 Hive CLI 提交的查询不会显示在 ResourceManager 中，但通过 Hue Beeswax 界面提交的查询会显示？

我有一个运行Yarn框架的ClouderaHadoop安装(CDH4)，我也安装了Hue。我注意到，当我通过Hue(Beeswax)界面提交Hive查询时，生成的mapreduce作业会显示在资源管理器WebUI以及Hue“作业浏览器”界面中。但是，如果我在任何节点上运行hivecli应用程序并从那里运行相同的查询，它似乎不会命中任何节点管理器，尽管它确实返回了正确的结果。我能想到的唯一区别是，Hue作业以我登录Hue的用户身份运行，而hivecli作业以启动hivecli的用户身份运行，这是一个不同的用户。我希望通过配置单元CLI提交的查询显示在资源管理器中。他们有什么理由不这样吗？

ResourceManager Beeswax section Hue 的 hadoop hive

azure - 通过 Web UI 或跨平台 CLI 创建示例 Azure Hadoop 作业？

我正在尝试使用HDInsight在Azure上使用Hadoop，但对如何在我新创建的集群上运行Hadoop作业感到有点困惑。到目前为止，我已经创建了一个HDInsight群集并为其附加了一个存储帐户。我还在我的本地OSX机器上安装了azure-cli。有一个AzuretutorialonlaunchingHadoopjobs，但它使用PowerShell，我认为它不能通过Azurecross-platformCLI获得.除了启动WindowsVirtualBox之外，是否可以通过AzureWebUI(例如像AmazonEMR提供的那样)或通过一些其他与OSX兼容的命令行参数来创建作业？

跨平台 Hadoop section noreferrer noopener azure azure-hdinsight

hadoop - yarn : get containers by applicationId

我想列出为特定MR作业运行容器的节点。我只有application_id。是否可以使用HadoopRESTAPI和/或通过命令行来完成？最佳答案这可以使用yarn来完成命令。运行yarnapplicationattempt-list获取应用尝试ID运行yarncontainer-list获取容器ID运行yarncontainer-status获取任何特定容器的主机。如果你想在bash脚本中使用它，或者想要获取具有大量容器的应用程序的每个主机，你可能想要解析出尝试/容器ID和主机，但这至少是一个开始。

applicationId containers section code 容器 hadoop hadoop-yarn

202 203 204205206 207 208