草庐IT

counter_field

全部标签

hadoop - pig 帮 : How can I add a fixed field that is not defined in the schema

如何添加架构中未定义的固定字段(例如日期或月份)?我运行了以下pig脚本以将固定日期添加到我的结果表中,并收到以下错误消息:Invalidfieldprojection。方案中不存在投影字段[日期]。joined_table=joinAby(key1),Bby(key1);result=foreachjoined_tablegenerate20140625asdate,A::value1asv1,B::value1asv2; 最佳答案 这是你可能想要的:result=FOREACHjoined_tableGENERATE'20140

hadoop - 配置单元:失败:SemanticException [错误 10001]:第 1:14 行未找到表 'Field'

那里!我是樱桃!最近一个问题总是困扰我很多时间!>usetest;OKTimetaken:0.046secondshive>showtables;OKdetectionindexfieldfirst1galspeclineneighborsphotoobjallphotozspplinessppparamsthingindexzoonospecTimetaken:0.092seconds,Fetched:11row(s)当我运行下面的命令时:hive-e"usetest;"hive-e"SELECT*fromField;"显示:FAILED:SemanticException[Erro

hadoop - Hive Server 2 节俭客户端错误 : Required field 'operationHandle' is unset

我正在尝试在CDH4.3上的hiveserver2上运行以下hivethrift代码并出现以下错误。这是我的代码:我可以成功运行到同一台服务器的配置单元jdbc连接,只是thrift不起作用。publicstaticvoidmain(String[]args)throwsException{TSockettransport=newTSocket("my.org.hiveserver2.com",10000);transport.setTimeout(999999999);TBinaryProtocolprotocol=newTBinaryProtocol(transport);TCLI

hadoop - 错误 1128 : Cannot find field dryTemp

我的pig运行代码temperature而我报错,把代码和报错放在下面,方便理解我的问题发生了。错误在第38行第15列,尝试删除dryTemp,又报错。代码:--Loadfilesintorelationsmonth1=LOAD'hdfs:/data/big/data/weather/weather/201201hourly.txt'USINGPigStorage(',');month2=LOAD'hdfs:/data/big/data/weather/weather/201202hourly.txt'USINGPigStorage(',');month3=LOAD'hdfs:/dat

hadoop - pig 脚本: count returns 0 on null field

我有一个pig脚本,它通过json的“公司”部分加载文件。当我执行计数时,如果文件中缺少域(或为空),则计数为0。我怎样才能将它分组为空字符串并仍然对其进行计数?文件示例:{"company":{"domain":"test1.com","name":"test1company"}}{"company":{"domain":"test1.com","name":"test1company"}}{"company":{"domain":"test1.com","name":"test2company"}}{"company":{"domain":"test2.com","name":"t

hadoop - CDH5 中的 Oozie 不获取 mapreduce.job.counters.max

当我运行一个oozie工作流,该工作流运行创建超过120个计数器的mapreduce-action(120是允许的默认最大计数器数)时,我收到一条错误消息,提示“计数器太多”。我已将mapreduce.job.counters.max设置为高于120的数字,但oozie似乎没有接受它。我在CDH5.1上使用hadoop2.3有没有人遇到过这种情况? 最佳答案 解决方案是将以下内容添加到YARNServiceMapReduceAdvancedConfigurationSnippet(SafetyValve):mapreduce.job

hadoop - Apache-PIG 脚本 : ERROR Invalid field projection on joined variable

我创建的Pig脚本有效,除非我尝试在我加入的字段上使用GENERATE。cc_data=LOAD'default.complaint1'USINGorg.apache.hive.hcatalog.pig.HCatLoader();cc2_data=LOAD'default.complaint2'USINGorg.apache.hive.hcatalog.pig.HCatLoader();combined=joincc_databycomplaintid,cc2_databycomplaintid;如果我对我的组合执行DESCRIBE,它会显示如下:合并:{cc_data::datere

hadoop - 在reducer的configure方法中调用progress或者增加counter

有可能吗?上下文:我的reducer配置方法需要从DistributedCache读取一组文件(总大小约为150MB)。但是,我不知道为什么hadoop需要这么长时间才能杀死一些reducer,尽管事实上有一些reducer已成功完成。我使用旧的API,我只能在配置方法中访问JobConfconf变量。我的想法是让reporter变量成为一个字段,然后我可以在配置方法中调用它。但似乎在调用reduce之前调用了configure。 最佳答案 转换您的代码以使用新的API!然后在setup()中,您可以访问context变量并调用pr

java - Apache 紧缩 : how to create custom counters

我想添加自定义counters到我的ApacheCrunch使用org.apache.hadoop.mapreduce.Reducer.Context.getCounterAPI的作业。有人知道如何从Crunch管道访问上下文吗? 最佳答案 最明显的地方是org.apache.crunch.DoFn#getCounter你猜怎么着?它在那里... 关于java-Apache紧缩:howtocreatecustomcounters,我们在StackOverflow上找到一个类似的问题:

java - Hadoop 方法 Counter.getName 和 Counter.getDisplayName 之间的区别

Counter.getName()方法与Counter.getDisplayName()方法有什么区别。我没有从文档中看到太多信息http://hadoop.apache.org/docs/r1.0.4/api/org/apache/hadoop/mapreduce/Counter.html请澄清。谢谢,文卡特 最佳答案 Hadoop框架对可读的计数器名称使用标准Java本地化。该名称由框架在内部使用,但当您看到计数器时显示的是显示名称。要查看它的实际效果,在与包含枚举的顶级类相同的目录中创建以枚举命名的属性文件。属性文件应包含一个