草庐IT

REGEX_EXTRACT

全部标签

regex - 使用点 '.' 的拆分无法使用 hive -e ""即使在放置双斜线之后

我使用以下查询来解析以点('.')分隔的数据。从配置单元控制台触发时,以下查询工作正常。我得到了这样的正确值:v=WijimLM4Khb5YUVrh7kl4bOWxYtIOtZwTRJ13977555161397755721139775573919但是当我使用hive-e""使用相同的查询时。它无法解析数据,解析列结果为空。nullnullnullnullnullnullnull查询:selectsplit(regexp_extract(cookie,'v=[^&\n\;\"]*',0),'\\.')[0],split(regexp_extract(cookie,'v=[^&\n\;\

PostgreSQL | EXTRACT / DATE_PART | 获取时间的年月日等字串

extractEXTRACT函数是PostgreSQL中用于从日期和时间类型中提取特定部分(如年、月、日、小时等)的函数。格式EXTRACT(fieldFROMsource)--field参数是要提取的部分,例如YEAR、MONTH、DAY、HOUR等。--source参数是包含日期或时间的表达式。示例例如,要从当前日期时间中提取年\月\日\,可以使用以下查询:SELECT EXTRACT(YEARFROMCURRENT_TIMESTAMP) AScurrent_year, EXTRACT(MONTHFROMCURRENT_TIMESTAMP) AScurrent_month, EXTRACT

hadoop - EMR : how to include semicolon in regex argument of EXTRACT function 上的 pig

我正在处理Pig中的一些数据,其中包括感兴趣的字符串,可以选择用分号分隔并以随机顺序排列,例如test=12345;foo=bartest=12345foo=bar;test=12345以下代码应提取测试“键”的字符串值:blah=FOREACHdataGENERATEFLATTEN(EXTRACT(str_of_interest,'test=(\\S+);?'))AS(test:chararray);但是,在运行代码时,我遇到了以下错误:mismatchedcharacter''expecting'''2013-04-1604:46:05,245[main]ERRORorg.apac

regex - 使用正则表达式匹配日志文件行时的可选字段

我正在尝试使用RegexSerDe通过正则表达式解析网络日志.它通过将每个正则表达式组与表中的列匹配来工作,如果正则表达式组为空,它会为该列分配一个空值。我在匹配缺少字段的日志行时遇到问题。此日志中有两种行:2016-10-23T23:59:59Zcache-iad2134fastly[502801]:52.55.94.131"-""-"Sun,23Oct201623:59:59GMTGET/apps/events/2016/10/11/3062653/?REC_ID=3062653&id=02002016-10-23T23:59:59Zcache-dfw1835fastly[5028

regex - Hive:在字符的第一次出现和最后一次出现之间提取字符串

我有一个Hive表列,其中的字符串由“-”分隔,我需要提取第一次和最后一次出现的“-”之间的字符串+-----------------+|col1|+-----------------+|abc-123-na-00-sf||123-abc-01-sd||123-abcd-sd|+-----------------+Requiredoutput:+-----------+|col1|+-----------+|123-na-00||abc-01||abcd|+-----------+请建议一些正则表达式来提取所需的输出。谢谢 最佳答案

regex - 如何在输入文件中找到导致错误的行 - PigLatin?

我有一个文件,每个文件有250k行。我正在尝试加载它们:apache_log=LOAD'apache_log/httpd-www02-access.log.2014-03-17-16*'USINGTextLoaderAS(line:chararray);apache_row=FOREACHapache_logGENERATEFLATTEN(REGEX_EXTRACT_ALL(line,'^".*?([\\d{1,3}.\\d{1,3}.\\d{1,3}.\\d{1,3}]*)"\\[(\\d{2}\\/\\w+\\/\\d{4}:\\d{2}:\\d{2}:\\d{2}\\+\\d{4

带有变音符号和一些国际化的德语全名的 PHP-RegEx

亲爱的Stackoverflowianers,尊敬的RegEx专家,我在网上搜索正则表达式模式,检查德语全名的合理性。我发现很多关于没有德语变音符号的模式的帖子......从所有这些帖子和我的逻辑理解我一起构建这个模式:^([A-ZÖÄÜ]{0,1})([-a-zäöüß\.']{2,30})({1}|-{1})([A-ZÄÖÜ]{0,1})([a-zäöüß']{0,30})({1}|-{1})?([A-ZÖÄÜ]{0,1})([a-zäöüß']{0,30})(({0,1}|-{1})([A-ZÖÄÜ]{0,1})([a-zäöüß']{0,30}))+$它应该匹配以下可能的变化(

PHP:转义 RegEx 保留字符 - 有人知道这有什么问题吗?

我正在尝试使用反斜杠转义正则表达式保留的字符(不要问-足以说明我不是在尝试解析HTML:))而且我遇到了一些奇怪的事情。$regex_chars=array('[','\\','^','$','.','|','?','*','+','(',')');$regex_chars_escaped=array('\[','\\\\','\^','\&','\.','\|','\?','\*','\+','\(','\)');$escaped_string=str_replace($regex_chars,$regex_chars_escaped,implode("",$regex_chars)

用于 url 字符串的 PHP RegEx

示例字符串:accuracy-is-5accuracy-is-5-or-15accuracy-is-5-or-15-or-20package-is-dip-8-or-dip-4-or-dip-16我当前的正则表达式:/^([a-z0-9\-]+)\-is\-([a-z0-9\.\-]*[a-z0-9])(?:\-or\-([a-z0-9\.\-]*[a-z0-9]))*$/U没有固定长度,部分:\-or\-[a-z0-9\.\-]可以重复。Bot现在从字符串"accuracy-is-5-or-15-or-20"我得到:Array([0]=>accuracy-is-5-or-15-or-

Android Studio--Can not extract resource from com.android.aaptcompiler.ParsedResource@5a5999f0

AndroidStudiobuildAPK报错:Cannotextractresourcefromcom.android.aaptcompiler.ParsedResource@5a5999f0.,Cannotextractresourcefromcom.android.aaptcompiler.ParsedResource@5e660663.查看报错日志:Causedby:com.android.aaptcompiler.ResourceCompilationException:FailedtocompilevaluesresourcefileD:\Software\AndroidStudi