master-data-management

hadoop - 无法连接到 Cloudera Manager，未监听端口 7180

如果有人帮助我在AWSEC2上运行cloudera管理器，我将不胜感激。这是我的第一次安装，我的目标是使用AWS免费套餐启动一些节点，并在Hadoop集群和cloudera分布上进行一些培训。我在AWSEC2上使用RedHatRHEL7.2镜像。我正在按照此处的说明进行操作...ClouderaManagerinstallation我已经安装了clouderamanagerOK，然后进入邀请您使用浏览器登录到clouderamanager服务器的屏幕。但这就是问题的开始。该应用程序似乎未在端口7180上监听，因此无法通过网络从另一台计算机进行连接。我什至无法在服务器上进行本地连接，但该

hadoop - 无法在 Windows 10 中启动 master for spark

我是Spark的新手，我正在尝试手动启动master(在Windows10中使用MINGW64)。当我这样做时，~/下载/spark-1.5.1-bin-hadoop2.4/spark-1.5.1-bin-hadoop2.4/sbin$./start-master.sh我得到了这些日志，ps:unknownoption--oTry`ps--help'formoreinformation.startingorg.apache.spark.deploy.master.Master,loggingto/c/Users/Raunak/Downloads/spark-1.5.1-bin-hado

Windows hadoop spark bin-hadoop apache-spark

hadoop - pig : Unable to load data using PigStorage

我在一个txt文件中有这个smaple数据集(格式:名字，姓氏，年龄，性别)(Eric,Ack,27,M),(Jeremy,Ross,29,F)(Jenny,Dicken,27,F),(Vijay,Sampath,40,M)(Angs,Dicken,28,M),(Venu,Rao,28,M)(Mahima,Mohanty,29,F),(Kenny,Oath,28,M)我正在尝试像这样加载此数据:tuple_record=LOAD'~/Documents/Pig_Tuple.txt'USINGPigStorage(',')AS(details:tuple(firstname:charar

PigStorage hadoop code chararray strong mapreduce apache-pig bigdata

hadoop - Amazon EMR Application Master Web UI？

我已经开始使用HadoopYARN(AMI3.3.1)在AmazonEMR上运行PIG作业，但是由于Yarn中不再有作业跟踪器，我似乎无法找到WebUI以便我可以跟踪MapReduce作业的Mappers和Reducers的数量，当我尝试访问资源管理器UI页面中提供的ApplicationMaster链接时，我被告知该页面不存在(下面提供的图片)。有谁知道我如何通过我的网络浏览器访问一个UI，它会根据映射器、reducer的数量和每个完成的百分比等向我显示当前的工作状态？谢谢最佳答案从ResourceManager网页单击App

Application hadoop section 私有 public hadoop-yarn hadoop2 amazon-emr

hadoop - HBase master 停止并出现 "Connetion Refused"错误

这发生在伪分布式和分布式模式中。当我尝试启动HBase时，最初所有3个服务-master、region和quorumpeer都会启动。然而不到一分钟，主人就停下了。在日志中，这是跟踪-2013-05-0620:10:25,525INFOorg.apache.hadoop.ipc.Client:Retryingconnecttoserver::9000.Alreadytried0time(s).2013-05-0620:10:26,528INFOorg.apache.hadoop.ipc.Client:Retryingconnecttoserver::9000.Alreadytried1

并出 Connetion hadoop apache master hbase cloudera

hadoop - 致命的 master.HMaster : Unexpected state : . 。无法将其转移到 OFFLINE

我遇到了严重的Hbase崩溃问题。我将HBase0.94.7与一个主服务器和两个区域服务器一起使用。HBasemaster经常崩溃，我什至无法重新启动它。我有如下主日志:DEBUGmaster.AssignmentManager:Handlingtransition=RS_ZK_REGION_CLOSED,server=master,60020,1374506461230,region=46c2333f401964bf877254be19c2cc8cDEBUGhandler.ClosedRegionHandler:HandlingCLOSEDeventfor6423df864603aa

Unexpected HMaster master AssignmentManager zookeeper hadoop hbase

azure - 在 Azure 上的 HDInsights 群集上使用 Data Lake 或 Blob

在Azure中创建HDInsightsHadoop集群时，有两个存储选项。AzureDataLakeStore(ADLS)或AzureBlob存储。这两个选项之间的真正区别是什么？它们如何影响性能？我找到了这个页面https://learn.microsoft.com/en-us/azure/data-lake-store/data-lake-store-comparison-with-blob-storage但它不是很具体，只使用了非常笼统的术语，比如“ADLSisoptimizedforanalytics”。这是否意味着它更适合存储HDInsights文件系统？如果ADLS确实更快

HDInsights azure noreferrer section microsoft hadoop azure-hdinsight azure-data-lake azure-blob-storage

java - 在 Java 中使用 Avro 的 MapReduce : String vs CharSequence vs Utf8 data types

我是使用Avro编写HadoopMapReduce的初学者，不清楚传入map/reduce方法与PairwithString、CharSequence或Utf8之间有什么区别？如果字符串只是简单的“helloworld”之类的东西怎么办？例如，这里有一个简单的映射方法，在本例中使用CharSequence作为输出键类型:publicvoidmap(Pairdatum,AvroCollector>collector,Reporterreporter)throwsIOException{Integernumber_one=newInteger(1);Stringoutput_key="he

CharSequence MapReduce code section java hadoop avro

data-structures - 如何存储图表并在其 hbase 上运行类似分析的页面排名？

很抱歉，如果这个问题看起来有点复杂，但我认为它都是相关的，所以我想尝试一下就得到答案。基本上我有一个分层图*，它有各种数据集，这些数据集只连接到下一组数据(所以set1的顶点有set2的边，依此类推，但set1没有连接到set3或set2以外的任何东西.这可能是相关的不确定)。通常，您可以将我的数据视为一棵巨大的家谱树(我在每个集合中添加大约十亿个节点)，我不断为每个新集合加载新的世代(家族创建新家族，没有边向后退)。我有一个正在运行的Hbase/hadoop系统，我知道如何使用java添加列和值，但我不知道该怎么做:以图形类型格式将数据添加到hbase(因为它是hbase，我想以一种

data-structures structures section hbase noreferrer graph hadoop graph-theory

hadoop - Cloudera 经理。未能检测到 Cloudera Manager Server

我有两台装有CentOS6.5的PCclient86-101.aihs.net80.94.86.101client86-103.aihs.net80.94.86.103cloudera-manager-server安装在client86-101.aihs.net上。我在检测ClouderaManagerServer时遇到问题(集群安装的第3步。)问题跟踪:BEGINhost-tPTR80.94.86.101101.86.94.80.in-addr.arpadomainnamepointerclient86-101.aihs.net.END(0)usingclient86-101.aih

Cloudera Manager section client code hadoop bigdata cloudera-manager

406 407 408409410 411 412