execute_manager

hadoop - 使用 Cloudera Manager 安装 CDH : No such file or directory

使用CM安装并成功下载和分发所有包裹。但是，所有代理都不会在分发100%完成时解压包裹。检查日志，它说:[21/Nov/201809:53:04+0000]30292MainThreadparcelINFOExecutingcommand['chown','root:yarn',u'/opt/cloudera/parcels/CDH-6.0.1-1.cdh6.0.1.p0.590678/lib/hadoop-yarn/bin/container-executor'][21/Nov/201809:53:04+0000]30292MainThreadparcelINFOchmod:/opt

hadoop - Hive managed table drop 不会删除 HDFS 上的文件。任何解决方案？

从hive中删除托管表时，它与hdfs中的关联文件不会被删除(在azure-databricks上)。我收到以下错误:[Simba]SparkJDBCDriverERRORprocessingquery/statement.ErrorCode:0,SQLstate:org.apache.spark.sql.AnalysisException:Cannotcreatethemanagedtable('`schema`.`XXXXX`').Theassociatedlocation('dbfs:/user/hive/warehouse/schema.db/XXXXX)alreadyexis

managed hadoop section schema stackoverflow hive hdfs azure-databricks

hadoop - pig 壳设置: automatically executing pig scripts

有没有办法在从命令行调用pig时自动运行pig脚本？我对此感到疑惑的原因是我有几个导入和定义语句，我经常反复使用这些语句来设置所有内容。是否可以在某个地方定义这个语句集合，以便当我启动pig时，它会自动执行这些行？如果这是我从文档中遗漏的微不足道的事情，我提前道歉。最佳答案是的，您当然可以从0.11版本开始这样做。您需要使用.pigbootup文件。这是一篇关于设置pigbootup文件的不错的博文http://hadoopified.wordpress.com/2013/02/06/pig-specify-a-default-

automatically executing section pig code hadoop apache-pig

hadoop - Cloudera Manager 和 hdfs-site.xml

使用ClouderaManager时，我可以通过以下方式访问hdfs-site.xml文件:ClouderaManager>Cluster>HDFS>Instances>(NameNode，例如)>Processes配置文件>hdfs-site.xml然后URL指向:http://quickstart.cloudera:7180/cmf/process/8/config?filename=hdfs-site.xml这个文件是否可以通过文件系统直接访问，如果可以，它位于何处最佳答案 ClouderaManager中设置的配置存储在C

hdfs-site Cloudera section hadoop hdfs cloudera-manager

hadoop - org.apache.hadoop.security.AccessControlException : Permission denied: user=test-user, access=EXECUTE, inode ="system":hadoop:test-user:rwx------

以前测试用户曾经驻留在连接丢失的边缘服务器上。因此，我们重建了边缘服务器并一直在尝试启动并运行它，但我一直收到以下错误。Jobinitializationfailed:org.apache.hadoop.security.AccessControlException:org.apache.hadoop.security.AccessControlException:Permissiondenied:user=test-user,access=EXECUTE,inode="system":hadoop:test-user:rwx------atsun.reflect.GeneratedC

hadoop test-user apache java

hadoop - Apache Hadoop Windows 10 - Datanode、Resource Manager 和 Yarn 在启动时立即关闭

我已经按照教程为Windows设置了ApacheHadoop，可以找到here.我现在遇到Datanode、ResourceManager和Yarncmd窗口的问题，显示打开后所有3秒都关闭，只有Namenode继续运行。这是我到目前为止尝试过的过程:以管理员身份运行CMD使用命令start-all.cmd(这会打开Namenode、Datanode、Yarn和Resourcemanagercmd窗口)Datanode、Yarn和Resourcemanager几乎都在启动后立即给出关闭消息SHUTDOWN_MSG:正在thood-alienware/...关闭ResourceManag

Datanode Resource section code hadoop hdfs disk

java - "Unable to execute HTTP Request: Broken Pipe"与 Amazon EMR 上的 Hadoop/s3

我开发了一个自定义JAR，我用它来处理ElasticMapReduce中的数据。数据是来自AmazonS3的数十万个文件。JAR没有做任何非常时髦的事情来读取数据-它只是使用CombineFileInputFormat。当我针对少量测试数据运行作业时，一切都完美无缺。然而，当我针对我的完整数据集运行它时，在我的工作中花费了一段(随机)时间，我会遇到某种似乎没有得到正确处理的HTTP或套接字错误。在一项工作中，我在SYSLOG中得到以下信息:2015-11-1621:47:17,504INFOcom.amazon.ws.emr.hadoop.fs.s3n.S3NativeFileSyst

amp Request java apache hadoop amazon-s3 mapreduce elastic-map-reduce

hadoop - 在 vectorized.execution.enabled 时将 ORC 文件格式与 Hive 一起使用时发生 ClassCastException

我有一个具有以下属性的配置单元表-ORC存储格式事务性=true按4个键分区-年、月、日、小时由groupingKey存储我正在使用HiveStreaming将数据直接填充到表中。现在我的问题是-我正在尝试运行以下查询selectcount(*)fromtable_name;我遇到异常Causedby:java.lang.ClassCastException:org.apache.hadoop.hive.ql.io.orc.OrcStruct$OrcStructInspectorcannotbecasttoorg.apache.hadoop.hive.serde2.objectinsp

ClassCastException 用时 section strong VectorizedBatchUtil hadoop mapreduce hive

android - 将 Apache Pig 导入 Android 项目导致 "Unable to execute dex: Java heap space"错误

我试图在我的Android应用程序中序列化一个TreeMap，这样我就可以将它保存到一个SharedPreferences，如thisStackOverflowQ&A中所建议的那样.它用于ArrayList，但我还是捕获了机会。重点是使用ApachePig项目中的ObjectSerializer类将TreeMap序列化为String并将其保存在共享首选项中的该数据类型中。然而，当我在不使用Hadoop的情况下导入.jar后，我就开始遇到很多错误。当我在模拟器中运行我的应用程序时(我使用的是Eclipse)，我的IDE底部的状态栏永远不会超过消息“正在启动[应用程序名称]100%...”

amp android section code stackoverflow serialization hadoop sharedpreferences apache-pig

hadoop - 无法连接到 Cloudera Manager，未监听端口 7180

如果有人帮助我在AWSEC2上运行cloudera管理器，我将不胜感激。这是我的第一次安装，我的目标是使用AWS免费套餐启动一些节点，并在Hadoop集群和cloudera分布上进行一些培训。我在AWSEC2上使用RedHatRHEL7.2镜像。我正在按照此处的说明进行操作...ClouderaManagerinstallation我已经安装了clouderamanagerOK，然后进入邀请您使用浏览器登录到clouderamanager服务器的屏幕。但这就是问题的开始。该应用程序似乎未在端口7180上监听，因此无法通过网络从另一台计算机进行连接。我什至无法在服务器上进行本地连接，但该

Cloudera Manager cloudera-scm-server server hadoop amazon-web-services amazon-ec2 cloudera-cdh