Cloudera-Agent

hadoop - 如何在cloudera quickstartVM -5.7.0中获取默认的HIVE_HOME？

如何在cloudera-quickstartVM-5.7中获取环境变量$HIVE_HOME的值？试图通过printenv查看存在的环境变量，它不存在。最佳答案 HIVE_HOME在调用hiveshell时设置。以下是找到HIVE_HOME的三种方法从hive命令行:[cloudera@quickstart~]$hive-e'!env'|grepHIVE_HOMEHIVE_HOME=/usr/lib/hive来自hiveshell-这将打印与上面相同的变量但是你不能在这里使用grep，所以你必须从所有变量的列表中找到HIVE_HOM

何在 quickstartVM code HIVE_HOME section hadoop hive sqoop

amazon-web-services - 设置 AWS 凭证 - Cloudera Quickstart Docker Container

我正在尝试使用Cloudera的Quickstartdocker容器来测试简单的Hadoop/Hive作业。我希望能够在S3中的数据上运行作业，但到目前为止我遇到了问题。我已将以下属性添加到core-site.xml、hive-site.xml、hdfs-site.xml。fs.s3.awsAccessKeyIdXXXXXXfs.s3.awsSecretAccessKeyXXXXXX无论如何，在Hive中尝试创建指向S3位置的外部表时，我收到错误:FAILED:SemanticExceptionjava.lang.IllegalArgumentException:AWSAccessKe

amazon-web-services Quickstart section gt lt hadoop hive cloudera cloudera-quickstart-vm

hadoop - 停止 Flume Agent

我有一个要求，我想以假脱机目录作为源来运行Flume代理。将假脱机目录中的所有文件复制到HDFS(sink)后，我希望代理停止，因为我知道所有文件都被推送到channel。此外，我想每次都针对不同的假脱机目录运行此步骤，并在目录中的所有文件都标记为.COMPLETED时停止代理。有什么办法可以停止flumeagent吗？最佳答案现在我建议在运行flumeagent时打开flumeagent终端。然后在这个终端执行ctrl+c，agent就没了。关于hadoop-停止FlumeAge

hadoop Flume section agent stackoverflow flume-ng

hadoop - cloudera垃圾检查点间隔配置

Cloudera允许我配置fs.trash.interval。但它不允许我配置fs.trash.checkpoint.interval。那么hdfs什么时候创建检查点呢？这里有一个类似的问题没有回应:WhendoesHadoopFrameworkcreatesacheckpoint(expunge)toits"current"directoryintrash? 最佳答案 ApacheHadoop文档包括左侧导航中指向各种*-default.xml文件的链接。这些文件包含所有配置属性的默认设置。如果您点击*-default.xml链接

cloudera hadoop trash interval checkpoint hdfs

hadoop - 写HDFS的flume agent在哪里运行？

我有25-20个代理将数据发送给几个收集器代理，然后这些收集器代理必须将数据写入HDFS。在哪里运行这些收集器代理？在Hadoop集群的Data节点上还是集群外？它们各自的优缺点是什么？人们目前是如何运行它们的？最佳答案第2层水槽代理使用hdfsSink直接写入HDFS。更重要的是，Tier1可以使用failoversinkgroup。如果第2层水槽代理之一出现故障。关于hadoop-写HDFS的flumeagent在哪里运行？，我们在StackOverflow上找到一个类似的问题

hadoop flume 收集器 section strong flume-ng

java - 无法在 Cloudera VM 中使用 java(在 Eclipse 中)连接到 hbase

我正在尝试在ClouderaVM中使用Java(在Eclipse中)连接到Hbase，但出现以下错误。能够在命令行中运行相同的程序(通过将我的程序转换为jar)我的java程序`importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.hbase.HBaseConfiguration;importorg.apache.hadoop.hbase.HColumnDescriptor;importorg.apache.hadoop.hbase.HTableDescriptor;importorg.apache.had

java Cloudera hadoop apache eclipse hbase

hadoop - 无法启动 Cloudera Manager Server，因为 RuntimeException : Upgrade not allowed from CM3. x

我在安装ClouderaManager(5.8.3版)时遇到了问题。我安装了cloudera-manager-agent-5.8.3-1.cm583.p0.8.el6.x86_64，cloudera-manager-server-5.8.3-1.cm583.p0.8.el6.x86_64,CentOS6.564位上的cloudera-manager-daemons-5.8.3-1.cm583.p0.8.el6.x86_64->使用$rpm-Uvh[包名]安装mysql并设置配置文件(/etc/cloudera-manager-server/db.properties)但是我联系了错误信

RuntimeException Cloudera springframework factory java hadoop hadoop-yarn cloudera-cdh cloudera-manager

hadoop - 如何使用 Yarn 在 Cloudera 上添加 Spark 工作节点

我们有cloudera5.2，用户希望开始使用Spark的全部潜力(在分布式模式下，它可以利用HDFS的数据局部性)，该服务已经安装并且可以在cloudera管理器状态(在home页面)但是当单击服务然后单击“实例”时，它只显示历史服务器角色，而在其他节点中显示网关服务器角色。根据我对Spark架构的理解，你有一个主节点和工作节点(与HDFS数据节点一起生活)所以在cloudera管理器中我尝试了“添加角色实例”，但只有“网关”角色可用。如何将Sparks工作节点(或执行程序)角色添加到具有HDFS数据节点的主机？还是没有必要(我认为由于yarn，yarn负责创建执行程序和应用程序主机

Cloudera hadoop Spark section Standalone apache-spark cloudera-cdh cloudera-manager

apache-spark - Kerberos Cloudera Hadoop 的 livy curl 请求错误

在kerberizedCDH5.10.x上配置了livy服务器，它在端口8998上运行良好，但curl请求给出以下错误，curl--negotiate-u:http://xxxxxxx:8998/sessionsError403HTTPERROR:403Problemaccessing/sessions.Reason:GSSException:Novalidcredentialsprovided(Mechanismlevel:FailedtofindanyKerberoscredentails)PoweredbyJetty://无法理解为什么请求没有通过kerberos安全层？

apache-spark Kerberos section strong 票证 hadoop cloudera livy

docker - Cloudera 管理器未运行

我正在尝试在GCP上使用以下docker镜像安装Cloudera:https://www.cloudera.com/documentation/enterprise/5-6-x/topics/quickstart_docker_container.html一旦该过程完成，我将运行以下命令:sudodockerrun--name=quickstart.cloudera--hostname=quickstart.cloudera-d--privileged=true-t-i-p7180:7180-p50070:50070-p80:80-p8888:8888cloudera/quicksta

Cloudera docker code quickstart hadoop google-cloud-platform cloudera-manager

13 14 151617 18 19