草庐IT

schema_format

全部标签

java - "cannot execute binary file: Exec format error"hdfs 命令

当我尝试运行命令时hdfsnodename-format我收到此错误消息:/usr/local/hadoop/bin/hdfs:line304:/usr/local/Java/jdk1.7.0_79/bin/java:cannotexecutebinaryfile:Execformaterror/usr/local/hadoop/bin/hdfs:line304:/usr/local/Java/jdk1.7.0_79/bin/java:Success现在,我打开了hdfs文件,这是第304行:exec"$JAVA"-Dproc_$COMMAND$JAVA_HEAP_MAX$HADOOP

regex - hive SERDE 正则表达式 : Output format - want to use only few of the output Strings

输入文件如下eno::ename::dept::sal101::emp1::comp1::2800000201::emp2::comp2::2800000301::emp3::comp3::3400000401::emp4::comp4::3600000501::emp5::comp5::400000>createtableemp(enamestring,edeptstring)>rowformatserde'org.apache.hadoop.hive.contrib.serde2.RegexSerDe'>WITHSERDEPROPERTIES(>"input.regex"="^([

hadoop - "the container format for fields in a row"对文件格式意味着什么?

来自Hadoop:权威指南:TherearetwodimensionsthatgoverntablestorageinHive:therowformatandthefileformat.Therowformatdictateshowrows,andthefieldsinaparticularrow,arestored.InHiveparlance,therowformatisdefinedbyaSerDe,aportmanteauwordforaSerializer-Deserializer.Whenactingasadeserializer,whichisthecasewhenque

hadoop - 指向本地文件的 AvroStorage schema_uri 不起作用

我像这样使用AvroStorage:STOREaliasINTO'$OUTPUT'USINGorg.apache.pig.piggybank.storage.avro.AvroStorage('{"index":1,"schema_uri":"file://path/schema.avsc"}');因此,从本地文件系统而不是HDFS获取schema.avsc是明确的。它在伪分布式集群中工作,但在模式文件的java.io.FileNotFoundException的普通集群上失败看起来这是在后端发生的。我假设这是因为AvroStorage在一个节点上的后端调用,与我运行pig脚本的节点不

hadoop - 我应该在集群的所有数据节点上运行 `hdfs namenode -format` 吗?

我正在设置Hadoop集群。据我了解,至少有两名worker的集群的最低设置是4台机器:名称节点资源经理数据节点1数据节点2我对hdfsnamenode-format命令感到困惑,看起来它只用于格式化名称节点,但它的描述(当运行一个空的hdfs命令时)声明“格式化DFS文件系统”。这是否意味着我也应该在所有数据节点上作为安装的一部分运行该命令,还是应该只在名称节点上运行? 最佳答案 您只需格式化一次。它告诉NameNode做一个格式化,这主要是一个元数据操作。您不一定需要在NameNode实际驻留的节点上执行此操作。应该可以从任何地

hadoop - 所需表缺失 : "DBS" in Catalog "" Schema ""

我正在尝试在我的Windows机器上运行Hive。但是,当我尝试从C:\hadoop-2.7.1\hive-2.1.0\bin>hive运行命令时,出现以下错误。Requiredtablemissing:"DBS"inCatalog""Schema"".DataNucleusrequiresthistabletoperformitspersistenceoperations.EitheryourMetaDataisincorrect,oryouneedtoenable"datanucleus.schema.autoCreateTables"org.datanucleus.store.r

date - Hadoop 黑斑羚 : Format datatype integer to date/timestamp to use addtime function

我在Impala中使用下表:customer_id|day_id|return_day_idABC2017083020170923BCD2017083020170901不幸的是,day_id和return_day_id字段都是INT而不是日期。如何将它们的数据类型更改为日期,以便我可以在day_id之后的4天内仅使用return_day_id计算不同的customer_id。我是否需要将其转换为日期,然后转换为时间戳,以便我可以使用adddate函数? 最佳答案 其中一条评论正确指出,您需要使用unix_timestamp和from

hadoop - Pig Schema 错误意外字符 ':'

我正在尝试使用2B:chararray作为一列的名称来创建一个pig模式。它给我一个错误信息2B:chararrayUnexpectedcharacter':'如果删除了该架构,则会创建该架构。这里有什么问题?架构是load'Batting.csv'usingorg.apache.pig.piggybank.storage.CSVExcelStorage(',','YES_MULTILINE','NOCHANGE','SKIP_INPUT_HEADER')as(yearID:int,sting:chararray,teamID:chararray,lgID:chararray,G:ch

postgresql - Sqoop 使用 --schema 参数导出到 postgres

在使用Sqoop导出数据到postgresql时,有什么方法可以提及不同的模式吗?基于URLhttp://sqoop.apache.org/docs/1.4.4/SqoopUserGuide.html,我需要使用----schema这很奇怪,但它不起作用。我也尝试使用--schema,但结果仍然相同。----schema适用于list-tables命令,但不适用于export命令。任何帮助将不胜感激。 最佳答案 终于成功了。为了使用“----schema”,我们需要在最后而不是中间提供该选项。所以这个会起作用:--connectjd

date - hive cast string to date in 'dd/MMM/yyyy' format order by and group by issue

我将日期存储为[27/Feb/2016:00:24:31+0530]。我想要27/Feb/2016中的日期格式,并且还想按它排序。我试过了this解决方案,但它以2016-02-27形式返回,并且也正确排序。SELECTTO_DATE(FROM_UNIXTIME(UNIX_TIMESTAMP(SUBSTR(time,2,11),'dd/MMM/yyyy')))ASreal_date,urlFROMcleanned_logsORDERBYreal_dateASC;为了获得所需的格式,我尝试使用date_format()函数。它在1.2.1中不可用,所以我从1.0.1切换到它。SELECT