草庐IT

re-assign

全部标签

python - Re.match() 总是返回 none

我觉得有点傻,但它不起作用:importrea="ebrjwjrbwerjwekwekjbrjERJKABBRAEJKEBWERWEJBEWJBKREWBJBWERBJ32J3B23BJBJ235JKBJJ5232"printre.match(ur'/(wekjb|ABB)/',a)ifre.match(ur'/(wekjb|ABB)/',a):print'success'如果用户给定的a是unicode,我有ur'。如果wekjb或ABB在字符串中,我想打印成功,但我总是得到None作为match. 最佳答案 re.match隐式

python - functools.wraps的 `assigned`和 `updated`参数如何使用?

我知道包装有如下属性:functools.wraps(wrapped[,assigned][,updated])但我想知道如何使用assigned和updated参数,有人有例子吗? 最佳答案 “已分配”参数告诉包装函数上的哪些属性将分配给包装(装饰)函数上的同名属性。默认情况下,它们是'__module__'、'__name__'、'__doc__',它们在变量functools.WRAPPER_ASSIGNMENTS中被定义为默认值。正如@abarnet在评论中所说,另一个可能想要复制的属性示例是Python3.x中的函数注释-

python - rsplit() 和 re.split() 的等价物是什么?

rsplit()在字符串的末尾开始拆分。使用re.split()时如何在字符串末尾开始拆分?例子:importresplitme="a!b?c!d"re.split(r"[!\?]",splitme,maxsplit=1)返回:a但是我想要:d当我在写这个问题时,我意识到我可以使用re.split(r"[!\?]",splitme)[-1]但这似乎不是最有效的方法,因为这会拆分整个字符串,而我们可以在第一个匹配项(从右边开始)后停止。 最佳答案 只想要最后一个就没必要拆分match=re.search(r'[^!?]*$',spli

Python-re.error : unterminated character set at position

以下代码:text="I'mastringthatcontainsthischaracters{},[],()"slice="thischaracters{},[],()"print([(m.start(0),m.end(0))forminre.finditer(slice,text)])显示错误:re.error:unterminatedcharactersetatposition12这很可能是因为元字符“{}、[]、()”。有没有什么正则表达式可以让finditer忽略它? 最佳答案 您必须转义正则表达式中的特殊字符:slice

python - 为什么re.split返回的list开头和结尾多了一个空串?

我正在尝试获取一串整数和/或float并创建一个float列表。该字符串将包含这些需要忽略的括号。我正在使用re.split,但如果我的字符串以括号开头和结尾,我会得到额外的空字符串。这是为什么?代码:importrex="[1234][2345]"y="1234][2345"p=re.compile(r'[^\d\.]+')printp.split(x)printp.split(y)输出:['','1','2','3','4','2','3','4','5','']['1','2','3','4','2','3','4','5'] 最佳答案

python - 如何从字符串中的某个索引开始使用 re.search?

看起来很简单,但我没有看到。如何从字符串中间开始搜索? 最佳答案 re.search函数不需要start像str这样的论点方法做。但是search编译方法re.compile/re.RegexObject模式确实采用pos争论。如果你仔细想想,这是有道理的。如果您真的需要反复使用相同的正则表达式,您可能应该编译它们。与其说是为了提高效率——缓存对大多数应用程序来说效果很好——只是为了提高可读性。但是,如果您因为某种原因无法预编译模式而需要使用顶级函数怎么办?嗯,有很多第三方正则表达式库。其中一些封装了PCRE或Google的RE2或

Python lambda if 语句 re.sub

所以我使用以下正则表达式来解析文本并从特定词典中获取信息:re.sub(r'()',lambdam:quotes[m.group(1)][1],text)我想做的是,如果要替换的是单独字典中的键,则只替换它。从逻辑上讲,它看起来像这样:re.sub(r'()',lambdam:quotes[m.group(1)][1]ifquotes[m.group(1)][1]ind,text)现在,如果我要运行以下命令,我会收到以下语法错误:>>>re.sub(r'()',lambdam:quotes[m.group(1)][1]ifquotes[m.group(1)][1]ind,text)Fi

python - Python 是否在 re 模块中使用 NFA 进行正则表达式评估?

有谁知道Python(任何版本)是否使用NFA(非确定性有限自动机)来评估正则表达式,或者它是否使用其他机制?如果可用,请提供链接/引用。 最佳答案 在DFA上这应该不到一毫秒:$timepython3-c'importre;re.match("a?"*25+"a"*25,"a"*25)'real0m7.273s25换100,一辈子都不会终止。这是它在DFA(grep)上的样子:$timeecho"aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

python - Python 2.7.1 的 re 模块中 re.split 函数和 re.DOTALL 标志的错误

我有一台运行Lion和Python2.7.1的Mac。我注意到re模块中有一些非常奇怪的东西。如果我运行以下行:printre.split(r'\s*,\s*','a,b,\nc,d,e,f,g,h,i,j,k,\nl,m,n,o,p,q,r')我得到这个结果:['a','b','c','d','e','f','g','h','i','j','k','l','m','n','o','p','q','r']但是如果我像这样使用re.DOTALL标志运行它:printre.split(r'\s*,\s*','a,b,\nc,d,e,f,g,h,i,j,k,\nl,m,n,o,p,q,r',

python - 为什么使用 pandas.assign 而不是简单地初始化新列?

我刚刚发现了pandas数据帧的assign方法,它看起来不错并且与R中dplyr的mutate非常相似。但是,我总是通过“即时”初始化一个新列。assign更好的原因是什么?例如(基于pandas文档中的示例),要在数据框中创建一个新列,我可以这样做:df=DataFrame({'A':range(1,11),'B':np.random.randn(10)})df['ln_A']=np.log(df['A'])但是pandas.DataFrame.assign文档建议这样做:df.assign(ln_A=lambdax:np.log(x.A))#ornewcol=np.log(df[