草庐IT

REGEX_EXTRACT

全部标签

regex - golang 正则表达式 ReplaceAllString

我正在用Go编程语言编写一个聊天机器人程序。在此函数中,它读取用户字符串以检查正则表达式,然后删除该表达式并在找到时替换为另一个字符串。它成功找到匹配项,但不会将其附加到字符串input="Iamfeelinghappy"pattern2:=[]string{`.*iam.*`,`.*IAM.*`,`.*I'm.*`,`.*i'm.*`,`.*im.*`,`.*Iam.*`}//loopthroughpattern2array//ifpatternisfoundextractsubstring//setresponsefor_,checkPattern:=rangepattern2{r

regex - 如何匹配多种语言

我正在用golang编写一个正则表达式来捕获可能以不同语言出现的主题标签。例如,很明显一个是英语,但可能会有拉丁语或阿拉伯语用户尝试使用这些字符集创建主题标签。我知道unicode字符类名称,但如何在不为每个字符生成正则表达式的情况下一次使用多个字符类名称?示例代码:r,err:=regexp.Compile(`\B(\#[[:ascii:]]+\b)[^?!;]*`)这将匹配"#hello#ذوق"并输出[]string{#hello,#ذوق}但不匹配"#ذوق" 最佳答案 我建议使用\B#[\p{L}\p{N}\p{M}_]+

regex - Go lang 从字符串中获取匹配的子字符串

我正在尝试从引号之间的字符串中提取所有单词。这是我当前的代码:funcStrExtract(wordstring)[]string{r,_:=regexp.Compile(`".*"`)result:=r.FindAllString(word,-1)RemoveDuplicates(&result)return(result)}测试代码here输入如下:`Higuys,thisisa"test"anda"demo"ok?`我得到输出:["test"anda"demo"]但我想得到:[testdemo]请帮我解决这个问题,或提出更好的替代方案。 最佳答案

regex - 编写没有否定的正则表达式

在之前的post我已经寻求一些帮助来重写一个没有否定的正则表达式开始正则表达式:https?:\/\/(?:.(?!https?:\/\/))+$结束于:https?:[^:]*$这工作正常,但我注意到,如果我的URL中除了来自http\s的:之外还有:,它不会选择。这是一个不起作用的字符串:sometextsometexhttp://websites.com/path/subpath/#query1sometexthttp://websites.com/path/subpath/:query2你可以注意到:query2我如何修改此处列出的第二个正则表达式,以便它选择包含:的url。预

regex - 有没有办法使用 Go.Regexp 匹配常量字符串以外的所有内容?

我发现了很多类似的questions不适用于Goregexsyntax.我尝试匹配的字符串是anything/anything/somestring的形式。使用模式\/.*\/.*\/(.*),我将匹配somestring,但我试图匹配除包含的字符串之外的任何内容>一些字符串。大多数答案建议使用像\/.*\/.*\/((?!somestring).*)这样的东西,但是在golangregexp中我得到:?前面的token是不可量化的。澄清一下:/test/test/MATCH会产生匹配,而/test/test/somestring不会。使用(有限的)Go正则表达式语法是否可行?

regex - Golang 正则表达式提取 2 个分隔符之间的文本 - 包括分隔符

如标题中所述,我在golang中有一个程序,其中有一个带有重复模式的字符串。我有这个模式的开始和结束定界符,我想从字符串中提取它们。以下为伪代码:string:="...ThisisprecedingtextPATTERNBEGINSHERE(patterncancontinueforanynumberoflines...);thisistrailingtextthatisnotpartofthepattern"简而言之,我试图从上面的示例中提取所有以“PATTERNBEGINSHERE”开头并以“;”结尾的模式。我需要帮助来弄清楚这个正则表达式是什么样的。如果需要任何其他信息或上下文

regex - 在 GO 中捕获重复组

我正在尝试创建一个可以解析字符串的函数,该字符串由一个大写单词后跟零个或多个封装在双引号中的参数组成。例如,以下每一行:COPY"filenameone""filenametwo"REMOVE"filename"LIST"x""y""z"DISCONNECT结果应该是一个字符串(命令)后跟一个字符串[](引号内的参数)。我创建了以下正则表达式:re1,_:=regexp.Compile(`([A-Z]+)(?:"([^"]+)")*`)results:=re1.FindAllStringSubmatch(input,-1)但是,无论我尝试什么,都只会捕获最后一个参数。我的问题示例:ht

regex - Go:一次通过正则表达式 FindAll 和 ReplaceAll

我正在解析网页以获取标签内的一些值,但我对标签不感兴趣,只对内容感兴趣。我正在使用regexp.FindAll获取所有匹配的表达式(包括标签),然后使用ReplaceAll替换每个子表达式,删除标签。当然,两次运行正则表达式会花费双倍的时间,我想避免这种情况。有没有办法同时应用这两个函数,或者等效的正则表达式?当然,我可以创建一个函数来删除标签,但在某些情况下可能会更复杂,因为标签长度可变(如),而正则表达式可以解决这个问题。此处是我的代码的一个简单示例(它不会在Playground上运行):http://play.golang.org/p/uGKjzmylSYfuncmain(){r

regex - 在 Golang 中从 HTML 中提取文本内容

在Golang中从字符串中提取内部子串的最佳方法是什么?输入:"Hellothisisparagraphthisisjunkthisisparagraph2thisisjunk2"输出:"thisisparagraph\nthisisparagraph2"是否有任何用于Go的字符串包/库已经做了类似的事情?packagemainimport("fmt""strings")funcmain(){longString:="Helloworldthisisparagraphthisisjunkthisisparagraph2thisisjunk2"newString:=getInnerStr

regex - 重写正则表达式而不取反

我写了这个正则表达式来帮助我从一些文本文件中提取一些链接:https?:\/\/(?:.(?!https?:\/\/))+$因为我正在使用golang/regexp库,所以我无法使用它,因为我的否定(?!..我想用它做的是选择从最后一次出现的http/https到最后的所有文本。sometextsometexhttp://websites.com/path/subpath/#query1sometexthttp://websites.com/path/subpath/#query2=>输出:http://websites.com/path/subpath/#query2谁能帮我解决问题