列的_草庐IT

hadoop - 对 SparkSQL 中数组列的每个元素执行 UDF(需要另一个 spark 作业)

hadoop - 根据 Pig 中一列的每个唯一值的计数创建列

我有一个数据集，例如:UserIDItemEventType001ABuy001BSell031ASell008CBuy001CBuy001ABuy008CSell如何将EventType列拆分为每个事件的不同列。也就是说，我想要两个新列EventType_Buy和EventType_Sell，其中包含每个UserID和Item对的这些事件的发生次数。所以输出应该是这样的:UserIDItemEventType_BuyEventType_Sell001A20001B01001C10008C11031A01我对排序不太感兴趣，但我计划稍后在R中使用此数据，因此我需要一些帮助来尝试执行此拆

hadoop Pig strong section 001 apache-pig

sql - HiveQL:如何删除基于两列的重复行

我正在创建一个无向图表，如下所示。+-------------------+------------------------+----------------------+|id|node_a|node_b|+-------------------+------------------------+----------------------+|1|a|b|+-------------------+------------------------+----------------------+|2|a|c|+-------------------+-------------------

HiveQL sql node section node_a hadoop hive

sql - Hive 划分同一列的数字

我有这样的表:A|null|15A|X|30B|null|10B|Y|20我想创建一个查询来划分A的数字，B的数字相同等等，所以输出应该是:row1|2row2|2考虑到我需要在单个查询中进行大约20次这样的计算，在Hive中处理此问题的最有效方法是什么？编辑:我总是有两行，一行是参数为空的行数，另一行是非空参数的数。我需要得到利率。最佳答案 selectcol1,max(casewhencol2isnotnullthencol3end)/nullif(max(casewhencol2isnullthencol3end),0)as

Hive sql section code pre hadoop

java - 更新 HBase 中整列的值

我有一个Hbase表，所有行都有一个特定的列值901877853087813636column=metadata:collection-id,timestamp=1514594631532,value=1007现在如何将表中所有行的值从1007更改为1008。所有帮助都指向修改特定行。请帮帮我最佳答案用SingleColumnValueFilter扫描表，得到value所在的所有行1007而不是你可以使用批量放置为所有这些行放置新值(1008)。例如扫描放置过滤器，如下所示:SingleColumnValueFiltersing

HBase java section SingleColumnValueFilter 1007 scala hadoop bigdata

hadoop - 结果中没有列的排序依据或排序依据

是否可以在HiveSQL中进行排序或排序但结果中没有该列？例如:|name|num||------|-----||bob|2||dan|1||lee|3|我想做这样的事情:SELECTnameFROMtableORDERBYnum但是我得到了这个错误:Invalidtablealiasorcolumnreference'num'有什么想法吗？最佳答案使用排序依据的子查询，并仅从您的主选择查询中选择所需的列hive>SELECTnameFROM(select*fromtableORDERBYnum)ct;

hadoop 依据 section code pre hive

mysql - 发现 MySQL 列的排序规则

我之前创建了一个MySQL表，现在我想了解某些字段使用的排序规则。我可以使用哪些SQL或MySQL命令来发现这一点？最佳答案您可以使用SHOWFULLCOLUMNSFROMtablename来返回列Collation，例如对于在列“name”上具有特殊排序规则的表“accounts”mysql>SHOWFULLCOLUMNSFROMaccounts;+----------+--------------+-------------------+------+-----+---------+----------+|Field|T

mysql section code NULL collation

mysql - 发现 MySQL 列的排序规则

我之前创建了一个MySQL表，现在我想了解某些字段使用的排序规则。我可以使用哪些SQL或MySQL命令来发现这一点？最佳答案您可以使用SHOWFULLCOLUMNSFROMtablename来返回列Collation，例如对于在列“name”上具有特殊排序规则的表“accounts”mysql>SHOWFULLCOLUMNSFROMaccounts;+----------+--------------+-------------------+------+-----+---------+----------+|Field|T

mysql section code NULL collation

hadoop - 如何在以xml为一列的hdfs中查询文件

上下文:我在mysql的表中有数据，其中xml作为一列。例如:表应用程序有3个字段。id(integer),details(xml),address(text)(在实际情况下，我这里有10-12个字段)。现在我们想用pig查询mysql表中所有字段的整个表。使用sqoop将mysql中的数据传输到hdfs中recorddelimiter'\u0005'andcolumndelimiteras"`"to/x.xml.然后使用将数据从x.xml加载到Pig中app=LOAD'/x.xml'USINGPigStorage('\u0005')AS(id:int,details:chararra

何在 hadoop section xml code hive apache-pig

hadoop - 中间有列的 Hive 表分区

我想用Hadoop上现有文件的分区创建一个表。我需要分区的日期值在文件中可用，但日期值列位置不是最后一个。它在中间。如何创建相同的表？示例如下:1John2012-01-10Miller2Austin2012-02-22Powers 最佳答案举个例子:你想要一个包含三列的分区Hive表(idINT,fnameSTRING,dtSTRING,lnameSTRING)whereid,fname,lname是分别存储一个整数id,stringfirstname和一个stringlastname的列，dt是一个string类型的分区列，包

hadoop Hive code STRING section