草庐IT

default-lazy-init

全部标签

hadoop - Hive 写入分区和 DEFAULT

我有一个日期时间表、一个事实表和一个分区表。目标是将date_time加入事实并插入到分区表中。它正在工作,因为我可以验证/apps/hive/warehouse/dbname.db/p_tbl/p_year=2016/p_month=01/p_day=01以及其他几个年、月、日文件夹是当前的。但是,我也有p_year=__HIVE_DEFAULT_PARTITION__/p_month=__HIVE_DEFAULT_PARTITION__/p_day=__HIVE_DEFAULT_PARTITION__充满了应该有自己的分区的数据。为什么某些年、月、日分区有效,而对于其他日期,它们被

hadoop - java.lang.NoSuchMethodError : org. apache.hadoop.fs.FsServerDefaults.<init>(JIISIZJLorg/apache/hadoop/util/DataChecksum$Type;)V

当我运行oozie示例时,在我的HADOOP2.6.5HA和oozie(使用oozie-4.1.0-cdh5.12.1)中。[oozie@mastershell]$catjob.propertiesnameNode=hdfs://cluster1:8020jobTracker=master:8032queueName=defaultexamplesRoot=examplesoozie.wf.application.path=${nameNode}/user/oozie/${examplesRoot}/apps/shell[hadoop@mastersbin]$[hadoop@maste

hadoop - 安装hadoop-cdh后/etc/init.d/下缺少初始化脚本

在Cloudera的文档中——“在集群上部署HDFS(使用命令行)”据说,要启动名称节点服务,请键入以下命令:forxin`cd/etc/init.d;lshadoop-hdfs-*`;dosudoservice$xstart;done问题是,/etc/init.d/目录下没有匹配hadoop-hdfs-*名称模式的项。我认为应该有一个hadoop-hdfs-namenode,不是吗?有人能告诉我为什么hadoop-hdfs-namenode不见了吗?我错过了任何部署步骤吗?非常感谢! 最佳答案 您在安装时缺少可选服务包。尝试安装h

java - 特定表的 hbase-default.xml 中单元格的最大大小

是否可以在hbase-default.xml中为特定表配置单元格的最大大小。如果可能,请告诉我我们配置最大单元格大小的方法列表。Reference:Igotthiserror,java.lang.IllegalArgumentException:**KeyValuesize**toolargeatorg.apache.hadoop.hbase.client.HTable.validatePut(HTable.java:1312)atorg.apache.hadoop.hbase.client.HTable.doPut(HTable.java:941)atorg.apache.hadoo

docker - Hue 访问 HDFS : bypass default hue. ini?

设置我正在尝试使用bde2020提供的图像组成一个轻量级的最小hadoop堆栈。(学习目的)。现在,堆栈包括(除其他外)一个名称节点数据说明色调基本上,我是从欧洲大数据开始的officialdockercompose,并添加了一个基于theirdocumentation的色调图像问题Hue的文件浏览器无法访问HDFS:Cannotaccess:/user/dav.TheHDFSRESTserviceisnotavailable.Note:youareaHueadminbutnotaHDFSsuperuser,"hdfs"orpartofHDFSsupergroup,"supergrou

hadoop - 无法建立与本地主机的连接 :10000/default: java.net.ConnectException:连接被拒绝

我从事Hadoop/Hive方面的工作。我已经安装了Hadoop1.1.2和Hive0.10.0。当我使用Hive作为命令提示符时它工作正常,但是当我在Eclipse中使用它时JDBC然后给出以下错误:Couldnotestablishconnectiontolocalhost:10000/default:java.net.ConnectException:Connectionrefused 最佳答案 您可以通过两种模式连接到Hive。通过thriftserver和嵌入式模式。通过查看您的urllocalhost:10000/def

hadoop - SET default_parallel 1;声明不适用于 pig

我是pig的新手,根据我的理解,SETdefault_parallel1语句应该生成一个输出文件,因为它将使用一个reducer。但是当我在下面的脚本中使用这个命令时,它给了我2个o/p文件。SETdefault_parallel1;A=LOAD'hdfs:/pigfldr/union1'usingPigStorage('')AS(sln:int);B=LOAD'hdfs:/pigfldr/union2'usingPigStorage('')AS(sln:int);C=UNIONA,B;STORECINTO'hdfs:/pigfldr/unionfres';

hadoop - hadoop-2.7.3 中的 yarn : yarn-default. xml 位置

我们正在尝试在hadoop-2.7.3中找到yarn-default.xml的位置,有人可以指出它可能位于的位置......我能够找到yarn-site.xml但找不到yarn-default.xml如果有人能指出它的位置,将不胜感激。 最佳答案 在包含您的hadoop安装的目录中导航到share/doc/hadoop/hadoop-yarn/hadoop-yarn-common.如您所知,yarn-default.xml用作默认值的文档,而yarn-site.xml代表您的自定义配置值。

java - 配置单元顶点失败 : killed/failed due to:ROOT_INPUT_INIT_FAILURE Caused by: java. lang.NullPointerException

我正在查询一个表,一个简单的计数(*)并收到以下错误:Vertexfailed,vertexName=Map1,vertexId=vertex_1486982569467_0809_3_00,diagnostics=[Vertexvertex_1486982569467_0809_3_00[Map1]killed/faileddueto:ROOT_INPUT_INIT_FAILURE,VertexInput:table_nameinitializerfailed,vertex=vertex_1486982569467_0809_3_00[Map1],java.lang.RuntimeE

apache-spark - java.lang.IllegalArgumentException 在 org.apache.xbean.asm5.ClassReader.<init>(未知来源)与 Java 10

每当我尝试收集我的rdd时,我就开始收到以下错误。我安装Java10.1后就发生了所以当然是把它拿出来重新安装,同样的错误。然后我安装了Java9.04同样的错误。然后我撕掉了python2.7.14,apachespark2.3.0和Hadoop2.7,同样的错误。有没有人有任何其他原因导致我不断收到错误消息?>>>fromoperatorimportadd>>>frompysparkimportSparkConf,SparkContext>>>importstring>>>importsys>>>importre>>>>>>sc=SparkContext(appName="NEW"