ecs-cli

hadoop - 从本地非 Hadoop 机器上传数据到 Amazon EC2 中运行的 HDFS

我在AmazonEC2上设置了一个包含两个节点的hadoop集群。它运作良好。我可以使用hadoopapi(附加java程序)从主节点或与hadoop集群位于同一Amazon区域的其他实例将数据上传到HDFS。但是，当我想从我的本地非hadoop机器上执行此操作时，结果如下所示:然后我登录到hadoop名称节点以使用命令行进行检查。文件夹“testdir”已创建，但上传文件“myfile”的大小为0。==================这是分隔符===============================这些是异常(exception)情况Apr18,201310:40:47AMor

中运 hadoop java apache amazon-ec2 hdfs

hadoop - Hive CLI '-e' 和 '-f' 选项不起作用

我正在使用Horton-worksHadoop解决方案，但无法执行配置单元命令行界面命令。使用-e选项，命令如下C:\somepath\hive-0.11\bin>hive-e'select*fromsampletable'在这里，我得到了错误'ParseException',cannotrecognizeinputnear'',''inselectclause.使用-f选项，命令如下C:\somepath\hive-0.11\bin>hive-f/user/myusername/sample.sql这里报错unabletoreadthefileatspecifiedlocation.

amp 39 section code blockquote hadoop hive hortonworks-data-platform

hadoop - Hive CLI 如何从 HDFS 中检索巨大的结果文件？

在我通过CLI执行配置单元查询后，如下所示:$hive-eQUERY>output.txtHive客户端将编译QUERY并将其发送到Hadoop集群。Hadoop执行一些作业并将结果输出到文件(假设仅1个reducer)在HDFS。然后Hive客户端将检索这个单个文件，提取它，并输出到本地STDOUT。流程如下图所示:==============HadoopCluster==============|||||2.outputRESULTasasingle.gzfileatHDFSbecauseof1reducer||||1.QUERY||||3.HiveretrievestheRESU

hadoop Hive section code beeline

java - org.apache.hadoop.security.AccessControlException : Permission denied when trying to access S3 bucket through s3n URI using Hadoop Java APIs on EC2

场景我创建了一个名为“my-role”的AWSIAM角色，将EC2指定为可信实体，即使用信任关系策略文档:{"Version":"2012-10-17","Statement":[{"Sid":"","Effect":"Allow","Principal":{"Service":"ec2.amazonaws.com"},"Action":"sts:AssumeRole"}]}该角色具有以下策略:{"Version":"2012-10-17","Statement":[{"Effect":"Allow","Action":["s3:AbortMultipartUpload","s3:De

AccessControlException Permission code 34 hadoop java amazon-web-services amazon-s3 tomcat7

django - 启动 Hue Server，CLI 显示 8000，配置显示 8888，实际上是 : Nothing

我已经启动了一个在EC2实例上运行的Hue服务器，该实例具有HDFS的伪分布式设置。当我启动服务器时，CLI指出服务器正在localhost:8000上运行:0errorsfoundDjangoversion1.6.10,usingsettings'desktop.settings'Startingdevelopmentserverathttp://127.0.0.1:8000/QuittheserverwithCONTROL-C.但是，配置告诉它在localhost:8888上启动:###hue.inisample#Webserverlistensonthisaddressandpo

Nothing django code section 8000 hadoop amazon-ec2 hdfs hue

amazon-ec2 - Amazon EC2 上的 Hadoop : Job tracker not starting properly

我们在AmazonEC2集群上运行Hadoop。我们启动主服务器、从服务器并附加ebs卷，最后等待hadoopjobtracker、tasktracker等启动，超时时间为3600秒。我们注意到50%的时间作业跟踪器无法在超时前启动。原因是，hdfs未正确初始化且仍处于安全模式且作业跟踪器无法启动。当我尝试手动ping从站时，我注意到EC2上节点之间的连接问题很少。有没有人遇到过类似的问题并且知道如何解决这个问题？最佳答案我不确定这个问题是否与AmazonEC2有关。我也经常遇到这个问题-虽然我的机器上有一个伪分布式安装。在这些

amazon-ec starting section 跟踪器 Amazon amazon-ec2 amazon-web-services cloud hadoop

EC2 上的 Hadoop 与 ElasticMapReduce/S3

我使用ElasticMapReduce有一段时间了。这很方便，但我无法运行HBase，因为Hadoop集群只是暂时可用(我在HBaseandHadoop上问过一些相关的问题)。所以我想尝试在一组EC2机器上安装Hadoop。我知道Hadoop有一些与EC2相关的目录-src/contrib/ec2。看起来只需键入命令即可启动Hadoop集群，我可以登录到主节点以运行作业等。在尝试这个之前，我想知道任何使用过这个的人的陷阱。谢谢! 最佳答案事实上，在亚马逊上使用hadoop有两种选择——配置您自己的集群或使用EMR。与此决定正交，您

ElasticMapReduce Hadoop section stackoverflow hbase

hadoop - 为什么通过 Hive CLI 提交的查询不会显示在 ResourceManager 中，但通过 Hue Beeswax 界面提交的查询会显示？

我有一个运行Yarn框架的ClouderaHadoop安装(CDH4)，我也安装了Hue。我注意到，当我通过Hue(Beeswax)界面提交Hive查询时，生成的mapreduce作业会显示在资源管理器WebUI以及Hue“作业浏览器”界面中。但是，如果我在任何节点上运行hivecli应用程序并从那里运行相同的查询，它似乎不会命中任何节点管理器，尽管它确实返回了正确的结果。我能想到的唯一区别是，Hue作业以我登录Hue的用户身份运行，而hivecli作业以启动hivecli的用户身份运行，这是一个不同的用户。我希望通过配置单元CLI提交的查询显示在资源管理器中。他们有什么理由不这样吗？

ResourceManager Beeswax section Hue 的 hadoop hive

azure - 通过 Web UI 或跨平台 CLI 创建示例 Azure Hadoop 作业？

我正在尝试使用HDInsight在Azure上使用Hadoop，但对如何在我新创建的集群上运行Hadoop作业感到有点困惑。到目前为止，我已经创建了一个HDInsight群集并为其附加了一个存储帐户。我还在我的本地OSX机器上安装了azure-cli。有一个AzuretutorialonlaunchingHadoopjobs，但它使用PowerShell，我认为它不能通过Azurecross-platformCLI获得.除了启动WindowsVirtualBox之外，是否可以通过AzureWebUI(例如像AmazonEMR提供的那样)或通过一些其他与OSX兼容的命令行参数来创建作业？

跨平台 Hadoop section noreferrer noopener azure azure-hdinsight

hadoop - 如何通过 whirr 在 EC2 集群上安装 JDK 7？

我有一些由OracleJDK7编译的map-reduce程序。我正在尝试使用whirr0.8.1来设置EC2集群来运行它们。不过whirr0.8.1默认安装的JDK好像是OpenJDK6，我在运行它们时遇到了以下错误:不支持的major.minor版本51.0因此我尝试通过设置指定whirr的JDK版本:whirr.java.install-function=install_oracle_jdk7但这会导致安装过程失败，尝试修改以下脚本似乎没有用:whirr-0.8.1\core\src\main\resources\functions\install_oracle_jdk7.sh有谁

hadoop whirr strong oracle amazon-ec2 amazon-web-services apache-whirr

138 139 140141142 143 144