草庐IT

Re-certify

全部标签

python - 如何在 Python 中使用正则表达式 re.sub() 一个可选的匹配组?

我的问题很简单。我有一个URL,有时它以特定字符结尾。如果它们存在,我想将它们添加到我的新URL。test1="url#123"test2="url"r=re.sub(r"url(#[0-9]+)?",r"new_url\1",test1)#Expectedresult:"new_url#123"#Actualresult:"new_url#123"r=re.sub(r"url(#[0-9]+)?",r"new_url\1",test2)#Expectedresult:"new_url"#Actualresult:"error:unmatchedgroup"当然,我不能只做re.sub

python - 使用 re.findall 查找前 x 个匹配项

我需要限制re.findall找到前3个匹配项然后停止。例如text='some1text2bla3regex4python5're.findall(r'\d',text)然后我得到:['1','2','3','4','5']我想要:['1','2','3'] 最佳答案 re.findall返回一个列表,所以最简单的解决方案就是使用slicing:>>>importre>>>text='some1text2bla3regex4python5'>>>re.findall(r'\d',text)[:3]#Getthefirst3item

python 3 : Monkey-patched code not re-importable by multiprocessing

简介当模块A的函数应该是可导入的时,我如何从模块B修改模块A,以便我可以使用multiprocessing标准库包运行模块A的函数?背景客户请求的修补程序不适用于我们的任何其他客户,因此我创建了一个新分支并专门为他们编写了一个单独的模块,以便轻松合并主分支的更改。为了保持客户端与预修补程序行为的向后兼容性,我将修补程序实现为应用程序中的可配置设置。因此,我不想替换我的旧代码——只是在设置打开时修补它。我通过monkeypatching做到了这一点.代码结构__main__模块读取配置文件。如果配置打开了修补程序的开关,__main__通过用hotfix模块中定义的代码替换几个函数来修补

python - 我可以使用 python 're' 来解析复杂的人名吗?

因此,我的主要痛点之一是名称理解以及拼凑家喻户晓的名称和头衔。我有一个80%的解决方案,其中包含一个非常庞大的正则表达式,我今天早上放在一起,我可能不应该为此感到自豪(但无论如何我都以一种病态的方式)正确匹配以下示例:JohnJeffriesJohnJeffries,M.D.JohnJeffries,MDJohnJeffriesandJimSmithJohnandJimJeffriesJohnJeffries&JenniferWilkes-Smith,DDS,MDJohnJeffries,CPA&JenniferWilkes-Smith,DDS,MDJohnJeffries,C.P.A

python - 使用 re.split 拆分字符串时的额外空元素

我正在尝试使用re.split在Python中拆分看起来像这样的字符串:#NAME="Foo"NAME2="foobar"NAME3="BARBAR"comp="NAME=\"Foo\"NAME2=\"FOOBAR\"NAME3=\"BARBAR\""这就是我的包含正则表达式的拆分函数的样子:re.split('(\s\w+\=\".*?\")',comp)结果是这样的:['NAME="Foo"','NAME2="foobar"','','NAME3="BARBAR"','']虽然这是正确的,但我想摆脱所有空元素。 最佳答案 这是您

python - re.sub 用逗号替换空格

我有一个看起来像这样的项目列表:2.4-2.04.3-6.012.51.0我想要的是删除所有这些空格并将它们替换为“,”(逗号),除了第一个数字前面的空格(它们应该被删除(空格)而不是替换为任何东西)。所以上面的字符串项在替换后应该是这样的:2.4,-2.0,4.3-6.0,12.5,1.0不是这样的:,2.4,-2.0,4.3,-6.0,12.5,1.0下面的代码是做什么的:newStrings=[]forsinstrings:newStrings.append(re.sub('\s+',',',s))应该使用re.sub的什么正则表达式来实现?谢谢。 最

python - re模块中的groups和groups有什么区别?

这里是:importre>>>s='abc-jk-lm'>>>m=re.search('-\w+\w+',s)>>>m.groups()()>>>m.group(0)'-jk'为什么groups()没有给我任何东西,但group(0)却有一些?有什么区别?跟进代码如下>>>re.findall('(-\w+\w+)',s)['-jk','-lm','-no']findall可以得到所有的-\w+\w+子串,但是看看这个:>>>m=re.search('(-\w+\w+)+',s)>>>m.groups()('-jk',)为什么search不能给我所有的子字符串?再次跟进如果s='abc

python - scrapy response.xpath 在具有默认命名空间的 xml 文档上返回空数组,而 response.re 有效

我是scrapy的新手,我正在玩scrapyshell试图抓取这个网站:www.spiegel.de/sitemap.xml我用scrapyshell"http://www.spiegel.de/sitemap.xml"在我使用的时候一切正常response.body我可以看到整个页面,包括xml标签但是例如这个:response.xpath('//loc')根本行不通。我得到的结果是一个空数组同时response.selector.re('somevalidregexpexpression')会起作用知道可能是什么原因吗?可能与编码有关?该网站不是utf-8我在Win7上使用pyth

python - 为什么\b 在 python re 模块中不起作用?

这个问题在这里已经有了答案:Doregularexpressionsfromtheremodulesupportwordboundaries(\b)?(5个答案)关闭5年前。众所周知,\b在正则表达式中表示单词边界。但是,python中re模块的以下代码不起作用:>>>p=re.compile('\baaa\b')>>>p.findall("aaavvv")[]我觉得findall的返回结果应该是["aaa"],但是什么也没找到。怎么了?

python - re.sub (".*", ", "(replacement )", "text") 在 Python 3.7 上加倍替换

在Python3.7上(在Windows64位上测试过),使用RegEx.*替换字符串会使输入字符串重复两次!在Python3.7.2上:>>>importre>>>re.sub(".*","(replacement)","sampletext")'(replacement)(replacement)'在Python3.6.4上:>>>importre>>>re.sub(".*","(replacement)","sampletext")'(replacement)'在Python2.7.5(32位)上:>>>importre>>>re.sub(".*","(replacement)"