草庐IT

replication-manager

全部标签

hadoop - "dfs.replication"和 "dfs.datanode.data.dir"配置如何在集群中工作?

我已按照Apache“单节点设置”说明在单节点上设置dfs.replication。但是后来我按照“ClusterSetup”进行操作,但它没有提到这个属性,所以我不知道这是要在Namenode上设置的属性,还是也/仅在Datanodes上设置的属性..我还读到在数据节点上的dfs.datanode.data.dir中设置多个(逗号分隔)路径将复制所有路径上的数据。所以我的问题是:dfs.replication将对哪个节点产生影响,如果dfs.datanode.data.dir的多个路径是设置,这些额外的独立复制是否仅针对每个数据节点,或者这些是否也以某种方式与dfs.replicat

hadoop - 定位 Cloudera Manager HDFS 配置文件

我已经通过ClouderaManager安装了一个集群,现在我需要手动启动集群。我一直在使用以下命令:$sudo-uhdfshadoopnamenode/datanode/jobtracker但是dfs.name.dir被设置为/tmp。我似乎找不到cloudera管理器在哪里有HDFS配置文件。/usr/lib/hadoop-02*/conf中的那些似乎是最小的。他们缺少dfs.name.dir,这是我特别要找的。顺便说一下,我在RHLE6系统上。由于懒惰,我虽然可以只复制cloudera管理器的HDFS配置文件,所以我不必手动创建它们,将它们复制到6个节点:)谢谢

hadoop - "Got error creating database manager"- sqoop 导入查询出错

场景:我正在尝试从sqlserver导入到HDFS,但出现以下错误:错误:hadoop@ubuntu:~/sqoop-1.1.0/bin$./sqoopimport--connect'jdbc:sqlserver://192.168.230.1;username=xxx;password=xxxxx;database=HadoopTest'--tablePersonInfo--target-dir/home/hadoop/hadoop-0.21.0/11/12/1012:13:20ERRORtool.BaseSqoopTool:Goterrorcreatingdatabasemanag

memory-management - HBase MemStore 和垃圾收集

我是HBase的新手,但我已经设置好HBase和Hadoop并了解一些相关知识。当我研究HBaseMemStore时,我对MemStore的全部了解是“MemStore是HBase放置必须写入或读取的数据的内存位置”。所以,这就是为什么我们想在何时何地阅读有关memstore的内容时,我们也会看到有关垃圾收集的讨论。现在我的问题是,memstore的唯一目的是在内存中保存可读和可写的数据吗?我们可以调整该内存的大小以获得hbase的快速回复吗?垃圾收集配置(收集器配置)会影响内存库吗?我认为应该是的。:) 最佳答案 关于HbaseM

hadoop - 在没有cloudera manager的情况下安装cloudera impala

请提供在没有cloudera管理器的情况下在ubuntu中安装imapala的链接。无法使用官方链接安装。无法使用这些查询定位包impala:sudoapt-getinstallimpala#Binariesfordaemonssudoapt-getinstallimpala-server#Servicestart/stopscriptsudoapt-getinstallimpala-state-store#Servicestart/stopscript 最佳答案 首先你需要获取包列表并将其存储在/etc/apt/sources.l

使用 hadoop MiniDFSCluster 时出现 javax.management.InstanceAlreadyExistsException

我正在使用MiniDFSCluster进行junit测试。现在我只是启动和关闭集群,junit运行绿色。但我得到这个异常(exception):javax.management.InstanceAlreadyExistsException:MXBeanalreadyregisteredwithnameHadoop:service=NameNode,name=MetricsSystem,sub=Controlatcom.sun.jmx.mbeanserver.MXBeanLookup.addReference(MXBeanLookup.java:120)atcom.sun.jmx.mbe

hadoop - YARN Application Master 无法连接到 Resource Manager

我有一个4节点集群(1个名称节点/资源管理器3个数据节点/节点管理器)我正在尝试运行一个简单的tez示例orderedWordCounthadoopjarC:\HDP\tez-0.4.0.2.1.1.0-1621\tez-mapreduce-examples-0.4.0.2.1.1.0-1621.jarorderedwordcountsample/test.txt/sample/out作业被接受,Applicationmaster和容器被设置但是在节点管理器上我看到了这些日志2014-09-1017:53:31,982INFO[ServiceThread:org.apache.tez.

postgresql - 无法使用 Cloudera Manager 安装 hadoop

我正在尝试使用clouderaManager5.9在单个VM中设置hadoop集群(为简单起见)。以下是我的环境的详细信息:HostOS->Windows10Virtualizationsoftware->Virtualbox5.1.10GuestOS->CentOS6.8我安装了ClouderaManager,并按照ClouderaManager的说明按照步骤操作。大部分安装步骤都很好,但在最后一次检查时失败了。下面是它的屏幕截图。如屏幕截图所示,它给出了错误:“意外错误。无法验证数据库连接。”我已经对Cloudera默认使用的Postgres数据库的配置文件进行了必要的更改,即它应

hadoop - 如何在hadoop中解析 'file could only be replicated to 0 nodes, instead of 1'?

我有一个简单的hadoop作业,可以抓取网站并将它们缓存到HDFS。映射器检查HDFS中是否已存在URL,如果存在,则使用它,否则下载页面并将其保存到HDFS。如果在下载页面时遇到网络错误(404等),则URL将被完全跳过-不会写入HDFS。每当我运行一个小列表~1000个网站时,我似乎总是遇到这个错误,它在我的伪分布式安装中反复使作业崩溃。可能是什么问题?我正在运行Hadoop0.20.2-cdh3u3。org.apache.hadoop.ipc.RemoteException:java.io.IOException:File/user/raj/cache/9b4edc6adab6f

java - SQOOP SQLSERVER 无法加载驱动程序 "appropriate connection manager is not being set"

我下载了sqljdbc4.jar.我正在调用sqoop就像从文件夹(存储jar的地方)一样:sqooplist-tables--drivercom.microsoft.jdbc.sqlserver.SQLServerDriver--connectjdbc:sqlserver://localhost:1433;user=me;password=myPassword;-libjars=./sqljdbc4.jar我收到以下警告和错误:13/10/2518:38:13WARNsqoop.ConnFactory:Parameter--driverissettoanexplicitdriverh