假设我有set_of_values:a,ka,la,mb,xb,yb,z如果我用a=RANKset_of_values;我得到:1,a,k2,a,l3,a,m4,b,x5,b,y6,b,z我想达到的是RANK,但是在组内。第一:a=groupset_of_valuesbyfirst_value;(a,{(a,k),(a,l),(a,m)})(b,{(b,x),(b,y),(b,z)})我现在应该怎么做才能得到:(a,{(1,a,k),(2,a,l),(3,a,m)})(b,{(1,b,x),(2,b,y),(3,b,z)})编辑(在foreach中添加RANK)b=foreacha{c
我正在编写一个相当基本的PigLatin脚本,但在执行GENERATE时遇到了问题。在GENERATE之前,转储显示数据与我预期的一样。但是,一旦我执行了GENERATE,结果就是一个空集。根据PigLatin引用手册,这似乎是正确的。当脚本运行时,我没有收到任何错误(它报告成功。)如果我在LOAD期间对字段使用名称或位置符号,则会发生这种情况。我的脚本:B=LOAD'data';DUMPB;C=FOREACHBGENERATE(int)$2,(int)$3,(int)$4;DESCRIBEC;DUMPC;这是输出:(2014-01-2608:14:21,672,1,0,1,55,..