我试图在Hive中运行此查询以仅返回在adimpression表中出现频率最高的前10个url。selectranked_mytable.url,ranked_mytable.cntfrom(selectiq.url,iq.cnt,rank()over(partitionbyiq.urlorderbyiq.cntdesc)rnkfrom(selecturl,count(*)cntfromstore.adimpressionaiinnerjoinzuppa.adgroupcreativesubscriptionagcsonagcs.id=ai.adgroupcreativesubscri
假设我有set_of_values:a,ka,la,mb,xb,yb,z如果我用a=RANKset_of_values;我得到:1,a,k2,a,l3,a,m4,b,x5,b,y6,b,z我想达到的是RANK,但是在组内。第一:a=groupset_of_valuesbyfirst_value;(a,{(a,k),(a,l),(a,m)})(b,{(b,x),(b,y),(b,z)})我现在应该怎么做才能得到:(a,{(1,a,k),(2,a,l),(3,a,m)})(b,{(1,b,x),(2,b,y),(3,b,z)})编辑(在foreach中添加RANK)b=foreacha{c