草庐IT

target_field

全部标签

hadoop - "the container format for fields in a row"对文件格式意味着什么?

来自Hadoop:权威指南:TherearetwodimensionsthatgoverntablestorageinHive:therowformatandthefileformat.Therowformatdictateshowrows,andthefieldsinaparticularrow,arestored.InHiveparlance,therowformatisdefinedbyaSerDe,aportmanteauwordforaSerializer-Deserializer.Whenactingasadeserializer,whichisthecasewhenque

hadoop - Apache pig : Easier way to filter by a bunch of values from the same field

假设我想根据同一字段中的值选择数据子集。现在我必须做这样的事情TestLocationsResults=FILTERSalesDataby(StoreId=='17'orStoreId=='85'orStoreId=='12'orStoreId=='45'orStoreId=='26'orStoreId=='75'orStoreId=='13')在SQL中,我们可以简单地这样做:SELECT*FROMSalesDatawhereStoreIDIN(17,12,85,45,26,75,13)Pig中是否有我缺少的类似快捷方式? 最佳答案

hadoop - Cloudera错误-java.lang.NoSuchFieldError : IS_SECURITY_ENABLED while trying to access this field

DoneMyHome工作到处搜索,但没有找到任何解决方案java.lang.NoSuchFieldError:IS_SECURITY_ENABLEDCDH包包含冲突的jar(jsp-api-2.1-6.1.14.jar、jasper-runtime-5.5.23.jar)。jsp-api-2.1-6.1.14.jar和jasper-runtime-5.5.23.jar包含不同版本的org.apache.Constants.java类。jasper-runtime-*jar不包含字段“IS_SECURITY_ENABLED”,因此jetty在尝试访问类org.apache.Constan

linux - 乌兹 : Sqoop dynamic target directory

我正在执行Oozie工作流中的sqoop作业。我可以在sqoop命令中创建具有静态名称的目标目录,如下所示。${jobTracker}${nameNode}job--execEMPLOYEE--meta-connectjdbc:hsqldb:hsql://:/sqoop----target-dir/user/test/Employee/20150126我需要创建带有日期的动态目标目录。我试过跟随,但没有用。${jobTracker}${nameNode}job--execEMPLOYEE--meta-connectjdbc:hsqldb:hsql://:/sqoop----target

hadoop - PIG 存储函数 : storing only certain fields is possible?

我有一个用例,我只需要将某些字段存储到HDFS。我知道我可以做一些foreach等等来保留感兴趣的领域,但我想知道这在Store函数中是否可行。 最佳答案 这可以使用您自定义的Store函数:http://ofps.oreilly.com/titles/9781449302641/load_and_store_funcs.html但一般来说,使用GENERATE并将所需字段存储在一些其他元组中要容易得多,这些元组将仅在STORE函数中使用 关于hadoop-PIG存储函数:storing

hadoop - Apache hive : How to use Unicode character (with octal above 177) as field delim

在我们的用例中,我们将获取格式如下的UTF-8文本数据:Data1§Data2Data3§Data4现在我们希望在ApacheHive中将Data1和Data3放在一列中,将Data2和Data4放在一列中。听起来很简单。但是,我们无法将§字符(即unicodeU+00A7“SectionSign”参见here)指定为字段分隔符。我们已经尝试了以下方法,都没有达到可接受的结果。1)使用方法终止的普通字段ROWFORMATDELIMITEDFIELDSTERMINATEDBY'§'返回(注意附加到每个单元格的?,在其他客户端中,unicode符号表示无法识别的符号)+----------

java - 读取 Avro 文件给出 AvroTypeException : missing required field error (even though the new field is declared null in schema)

我正在尝试反序列化/读取Avro文件,avro数据文件没有新字段。即使新字段在模式中声明为null,它也应该是可选的。但它仍然给我错误作为强制性的。Exceptioninthread"main"org.apache.avro.AvroTypeException:Foundcom.kiran.avro.User,expectingcom.kiran.avro.User,missingrequiredfieldlocAVRO模式声明:{"name":"loc","type":["string","null"]}使用代码读取文件:DatumReaderuserDatumReader=newS

hadoop - pig : Pulling individual fields out after a GROUP

在PigLatin中,我想从要选择的记录中提取其他字段,因为有聚合,例如MAX。我无法解释这个问题,所以这里有一个例子。假设我想获取家中最年长者的姓名:关系A是四列,(name,address,zipcode,age)B=GROUPABY(address,zipcode);#groupbytheaddress#generatetheaddress,theperson'sage,buthowdoIgrabthatperson'sname?C=FOREACHBGENERATEFLATTEN(group),MAX(age),???Name???;如何生成年龄为MAX的人的姓名?

hadoop - pig : Invalid field Projection; Projected Field does not exist

describefilter_records;这给了我以下格式:filter_records:{details1:(firstname:chararray,lastname:chararray,age:int,gender:chararray),details2:(firstname:chararray,lastname:chararray,age:int,gender:chararray)}我想显示details1和details2中的firstname。我试过这个:display_records=FOREACHfilter_recordsGENERATEdisplay1.first

hadoop - HDFS 错误 : target already exists

我是Hadoop的新手。当我尝试执行此命令时,它说目标已经存在。如何从hadoop中删除此文件?这与删除目标一样吗?me$hdfs-copyFromLocalmyfile.txtinput/myfile.txtcopyFromLocal:Targetinput/myfile.txtalreadyexists 最佳答案 您不必先删除文件再复制新文件。您可以将-f选项与-copyFromLocal一起使用,一步完成hadoopfs-copyFromLocal-fmyfile.txtinput/myfile.txt