草庐IT

single-version-externally-managed

全部标签

hadoop - 我想知道(公式)如何计算 namenode、yarn 和 Resource Manager 的 RAM、CPU 和磁盘内存

我正在尝试构建不同大小的集群,这就是为什么我需要可以从中计算namenode、yarn和资源管理器的RAM、CPU和磁盘内存的公式。还想知道RAM、CPU和磁盘之间的关系。 最佳答案 您可以使用Cloudera指南Download 关于hadoop-我想知道(公式)如何计算namenode、yarn和ResourceManager的RAM、CPU和磁盘内存,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.co

hadoop - 由于 hbase 客户端 jar 中的硬编码 managed=true,无法连接到 Bigtable 以扫描 HTable 数据

我正在开发一个自定义加载函数,以便在Dataproc上使用Pig从Bigtable加载数据。我使用从Dataproc获取的以下jar文件列表编译我的java代码。当我运行以下Pig脚本时,它在尝试与Bigtable建立连接时失败。错误信息是:Bigtabledoesnotsupportmanagedconnections.问题:是否有解决此问题的方法?这是一个已知问题吗?是否有解决或调整的计划?是否有不同的方法将多重扫描作为Pig的加载函数来实现并与Bigtable一起工作?详细信息:Jar文件:hadoop-common-2.7.3.jarhbase-client-1.2.2.jar

Hadoop安装配置 : multiple versions side-by-side on same host

能否在同一个系统上以伪分布式的方式安装不同版本的Hadoop?其实我想探索不同版本的hadoop-1.x和hadoop-2.x的特性,我已经在运行Linux的两个不同系统上配置了hadoop-1.x和hadoop-2.x。有什么方法可以在同一台机器上配置吗? 最佳答案 是的,可以在同一台主机上并排安装多个版本的Hadoop软件。将不同版本的Hadoop软件提取到单独的子目录中。为不同的版本创建单独的配置文件(core-site.xml、hdfs-site.xml、yarn-site.xml等),并将这些文件集保存在单独的目录中。确保

hadoop - 无法在端口 7180 上设置 cloudera manager web - 集群安装

我正在使用具有以下主机名的ubuntu本地计算机并尝试设置clouderaHadoopDistributionCDH5。chaithu@localhost:~$hostnamelocalhostchaithu@localhost:~$hostname-flocalhostchaithu@localhost:~$sshchaithu@localhostWelcometoUbuntu16.04.2LTS(GNU/Linux4.8.0-36-genericx86_64)*Documentation:https://help.ubuntu.com*Management:https://land

hadoop - 使用 Cloudera Manager 安装 CDH : No such file or directory

使用CM安装并成功下载和分发所有包裹。但是,所有代理都不会在分发100%完成时解压包裹。检查日志,它说:[21/Nov/201809:53:04+0000]30292MainThreadparcelINFOExecutingcommand['chown','root:yarn',u'/opt/cloudera/parcels/CDH-6.0.1-1.cdh6.0.1.p0.590678/lib/hadoop-yarn/bin/container-executor'][21/Nov/201809:53:04+0000]30292MainThreadparcelINFOchmod:/opt

hadoop - Hive managed table drop 不会删除 HDFS 上的文件。任何解决方案?

从hive中删除托管表时,它与hdfs中的关联文件不会被删除(在azure-databricks上)。我收到以下错误:[Simba]SparkJDBCDriverERRORprocessingquery/statement.ErrorCode:0,SQLstate:org.apache.spark.sql.AnalysisException:Cannotcreatethemanagedtable('`schema`.`XXXXX`').Theassociatedlocation('dbfs:/user/hive/warehouse/schema.db/XXXXX)alreadyexis

hadoop - hadoop.tmp.dir 的 VERSION 文件有什么用

最近我格式化了namenode并且在启动hadoop守护进程时datanode失败并给出如下错误2019-01-1110:39:15,449WARNorg.apache.hadoop.hdfs.server.common.Storage:Failedtoaddstoragedirectory[DISK]file:/app/hadoop/tmp/dfs/data/java.io.IOException:IncompatibleclusterIDsin/app/hadoop/tmp/dfs/data:namenodeclusterID=CID-76c39119-061a-4ecf-9de1

hadoop - Cloudera Manager 和 hdfs-site.xml

使用ClouderaManager时,我可以通过以下方式访问hdfs-site.xml文件:ClouderaManager>Cluster>HDFS>Instances>(NameNode,例如)>Processes配置文件>hdfs-site.xml然后URL指向:http://quickstart.cloudera:7180/cmf/process/8/config?filename=hdfs-site.xml这个文件是否可以通过文件系统直接访问,如果可以,它位于何处 最佳答案 ClouderaManager中设置的配置存储在C

hadoop - 配置单元 2.3.3 MetaException(消息 :Version information not found in metastore.)

我有Hive2.3.3和Hadoop3.1.0。我可以在终端上使用hive命令启动Hive,但是当我尝试创建表时,我收到以下错误:user$hivereadlink:illegaloption--fusage:readlink[-n][file...]SLF4J:ClasspathcontainsmultipleSLF4Jbindings.SLF4J:Foundbindingin[jar:file:/Users/caiocesare/Desktop/hive/lib/log4j-slf4j-impl-2.6.2.jar!/org/slf4j/impl/StaticLoggerBinde

java - 获取 E0902 : Exception occured:[Server IPC version 9 cannot communicate with client version 4]

我的hadoop版本是2.7.1,我的oozie版本是3.3.2。我已经创建了oozie.war文件成功。但是,当我尝试使用以下命令在hdfs中创建共享库时,oozie-setup.shsharelibcreate-fshdfs://training-21:54310我得到以下异常,Stacktracefortheerrorwas(fordebugpurposes):--------------------------------------org.apache.oozie.service.HadoopAccessorException:E0902:Exceptionoccured:[