草庐IT

mm_extract_ps

全部标签

regex - 配置单元查询 regexp_extract

我正在尝试从“[223.104.227.42]”中提取IP地址。我想提取“[”和“]”之间的223.104.227.42,我正在使用这个查询:selectregexp_extract('[223.104.227.42]','\\[(.*?)\\]')但是我得到一个错误:FAILED:Infunctionregexp_extract,patternmusthasonegroupreferenceatleast. 最佳答案 尝试将捕获组索引指定为参数(1):hive>selectregexp_extract('[223.104.227.

regex - 使用 REGEXP_EXTRACT 没有给出预期的结果 - Hive

我正在尝试在Hive中使用REGEXP_EXTRACT函数从列中获取所需的字符串。列中数据的形式为:单词\more_words我需要提取\之后的字符串部分。我试着做这样的事情:SELECTREGEXP_EXTRACT('words\more_words','(.*)(\\+)(.*)',3)->不返回任何内容SELECTREGEXP_EXTRACT('words\more_words','.*(\\+)(.*)',2)->不返回任何内容SELECTREGEXP_EXTRACT('words\more_words','\w+(\\+)(\w+)',2)->什么都不返回SELECTREGE

hadoop - Pig Latin 中的 STRSPLIT 和 REGEXP_EXTRACT_ALL

我有以下文件:File----12-3John1215-1Sam122该文件是制表符(\t)分隔的。我将行加载为line:chararray,因为我希望数据不会在各个字段中拆分。现在,我想提取详细信息(12-3和5-1)并将其存储为单独的数据。我正在尝试使用STRSPLIT和REGEX_EXTRACT_ALL,但数据似乎不匹配。splitdata=FOREACHfiledata{regex=REGEX_EXTRACT_ALL(line,'^([0-9]*)\\-([0-9]*)');split=STRSPLIT(line,'\\t',1);GENERATEregex,split;};这

hadoop - 将日期字符串转换为 “MM/DD/YY” 格式

我刚看到这个例子。我怎样才能解决这个问题。Hivemetastore包含一个名为problem1的数据库,其中包含一个名为customer的表。customer表包含9000万条客户记录(90,000,000),每条记录都有一个生日字段。示例数据(生日以粗体显示)1904287ChristopherRodriguezJan11,200396391595ThomasStewart6/17/19692236067JohnNelson08/22/54对于解决方案表中的每一行,将生日字段的内容替换为“MM/DD/YY”格式的日期字符串。MM是补零的月份(01-12),DD是补零日(01-31)

hadoop - Apache Hive regexp_extract UDF

我在ApacheHive中遇到一段代码,如regexp_extract(input,'[0-9]*',0),有人可以向我解释这段代码的作用吗?谢谢 最佳答案 来自theHivemanualDDL,它返回使用模式提取的字符串。例如regexp_extract('foothebar','foo(.*?)(bar)',2)返回bar。index参数是捕获组,它是一个整数,可以取以下值:0:整个比赛,在我的例子中是foothebar1:第一组,在我的例子中是the2:第二组,在我的例子中是barn:第n组。如果n大于正则表达式中定义的实际组

hadoop - 在 Hive 中将 mm/dd/yyyy 转换为 yyyy-mm-dd

我有一个日期格式为mm/dd/yyyy的列。如何将其转换为yyyy-mm-dd格式?试过这个:-配置单元>选择to_date(from_unixtime(unix_timestamp('02/22/2015','yyyy-mm-dd')));但它不起作用 最佳答案 你可以试试这个:selectfrom_unixtime(unix_timestamp('02/22/2015','MM/dd/yyyy'),'yyyy-MM-dd')fromtable; 关于hadoop-在Hive中将mm/

9. 成功解决:Driver class ‘org.gjt.mm.mysql.Driver‘ could not be found

❤️个人主页:水滴技术🌸订阅专栏:成功解决BUG合集🚀支持水滴:点赞👍+收藏⭐+留言💬问题描述在使用Kettle(Spoon)工具创建MySQL数据库连接时,提示:Driverclass'org.gjt.mm.mysql.Driver'couldnotbefound,makesurethe'MySQL'driver(jarfile)isinstalled.org.gjt.mm.mysql.Driver该提示的意思是缺少MySQL相关的JDBC驱动。原因分析Kettle并工具并没有为所有的数据库提供JDBC驱动,需要自行下载,然后放到lib目录中。解决方案从MySQL官网下载驱动包,步骤如下:第

regex - 如何使用 Hive REGEXP_EXTRACT() 函数删除非字母数字或非数字字符

我一直在尝试弄清楚如何删除多个非字母数字或非数字字符,或者仅返回字符串中的数字字符。我试过:SELECTregexp_extract('X789','[0-9]',0)FROMtable_name但它返回“7”,而不是“789”。我还尝试使用NOTMATCH语法删除非数字字符^((?!regexp).)*$:SELECTREGEXP_REPLACE('X789','^((?![0-9]).)*$','')FROMjav_test_iiregexp_extract能否返回多个匹配项?我真正想做的是清理我的数据,使其只包含数字或字母数字字符。这似乎有助于删除坏字符,但它不是像[0-9]这样

php - 使用 extract($variables) 获取内容,但变量未定义

我还没有掌握extract()函数和传输变量的窍门。我在用户Controller中有一个方法,其中定义了一些变量,并以数组形式发送到父Controller中的View函数,其中提取了数组。然后需要View。但是变量结果未定义。虽然可以打印数组内容。这是具有简化配置文件功能的用户Controller:classUserextendsController{publicfunctionprofile(){$profiledetails=$this->profiledetails();$profilestatus=$this->profileStatus();$this->view('prof

php - 如何转换yyyy-MM-ddTHH :mm:ssZ to yyyy-MM-dd HH:mm:ss?

Paypal返回以下格式的时间戳:yyyy-MM-ddTHH:mm:ssZ我不知道该怎么办...如何在php中使用本地时区将其转换为yyyy-MM-ddHH:mm:ss?我很想preg_replace那些神秘的字母,但有件事告诉我一定有更好的方法。我的区域似乎也有8小时的差异,我不确定如何减去。 最佳答案 使用DateTime上课施展你的魔法。$date=newDateTime('2012-09-09T21:24:34Z');$date->format('Y-m-d');#readformatfromdate()function