草庐IT

matching

全部标签

python - 确定一个企业名称是否与另一个非常相似 - Python

我正在处理大型企业数据库。我希望能够比较两个公司名称的相似性,看看它们是否可能是重复的。以下是应测试为很可能重复的企业名称列表,有什么好的方法可以解决这个问题?GeorgeWashingtonMiddleSchlGeorgeWashingtonSchoolSantaFeEastIncSantaFeEastChop'tCreativeSaladCoChop'tCreativeSaladCompanyMannyandOlga'sPizzaManny's&Olga'sPizzaRay'sHellBurgerTooRay'sHellBurgersElSolElSoldeAmericaOlney

python - 确定一个企业名称是否与另一个非常相似 - Python

我正在处理大型企业数据库。我希望能够比较两个公司名称的相似性,看看它们是否可能是重复的。以下是应测试为很可能重复的企业名称列表,有什么好的方法可以解决这个问题?GeorgeWashingtonMiddleSchlGeorgeWashingtonSchoolSantaFeEastIncSantaFeEastChop'tCreativeSaladCoChop'tCreativeSaladCompanyMannyandOlga'sPizzaManny's&Olga'sPizzaRay'sHellBurgerTooRay'sHellBurgersElSolElSoldeAmericaOlney

python - 替代 `match = re.match(); if match: ...` 成语?

如果您想检查某项是否与正则表达式匹配,如果是,请打印第一组,您就可以了..importrematch=re.match("(\d+)g","123g")ifmatchisnotNone:printmatch.group(1)这完全是迂腐的,但是中间的match变量有点烦人..像Perl这样的语言通过为匹配组创建新的$1..$9变量来做到这一点,比如..if($blah~=/(\d+)g/){print$1}来自thisredditcomment,withre_context.match('^blah',s)asmatch:ifmatch:...else:.....我认为这是一个有趣的想

python - 替代 `match = re.match(); if match: ...` 成语?

如果您想检查某项是否与正则表达式匹配,如果是,请打印第一组,您就可以了..importrematch=re.match("(\d+)g","123g")ifmatchisnotNone:printmatch.group(1)这完全是迂腐的,但是中间的match变量有点烦人..像Perl这样的语言通过为匹配组创建新的$1..$9变量来做到这一点,比如..if($blah~=/(\d+)g/){print$1}来自thisredditcomment,withre_context.match('^blah',s)asmatch:ifmatch:...else:.....我认为这是一个有趣的想

python - 正则表达式 : match start or whitespace

正则表达式可以匹配空格或字符串的开头吗?我正在尝试用英镑符号替换货币缩写GBP。我可以匹配任何以GBP开头的东西,但我想更保守一点,并在它周围寻找某些分隔符。>>>importre>>>text=u'GBP5OffwhenyouspendGBP75.00'>>>re.sub(ur'GBP([\W\d])',ur'£\g',text)#matchesGBPwithanyprefixu'\xa35Offwhenyouspend\xa375.00'>>>re.sub(ur'^GBP([\W\d])',ur'£\g',text)#matchesatstartonlyu'\xa35Offwhen

python - 正则表达式 : match start or whitespace

正则表达式可以匹配空格或字符串的开头吗?我正在尝试用英镑符号替换货币缩写GBP。我可以匹配任何以GBP开头的东西,但我想更保守一点,并在它周围寻找某些分隔符。>>>importre>>>text=u'GBP5OffwhenyouspendGBP75.00'>>>re.sub(ur'GBP([\W\d])',ur'£\g',text)#matchesGBPwithanyprefixu'\xa35Offwhenyouspend\xa375.00'>>>re.sub(ur'^GBP([\W\d])',ur'£\g',text)#matchesatstartonlyu'\xa35Offwhen

python - 类型错误 : ufunc 'add' did not contain a loop with signature matching types

我正在创建句子的词袋表示。然后将句子中存在的单词与文件“vectors.txt”进行比较,以获得它们的嵌入向量。在获得句子中存在的每个单词的向量后,我将取句子中单词向量的平均值。这是我的代码:importnltkimportnumpyasnpfromnltkimportFreqDistfromnltk.corpusimportbrownnews=brown.words(categories='news')news_sents=brown.sents(categories='news')fdist=FreqDist(w.lower()forwinnews)vocabulary=[word

python - 类型错误 : ufunc 'add' did not contain a loop with signature matching types

我正在创建句子的词袋表示。然后将句子中存在的单词与文件“vectors.txt”进行比较,以获得它们的嵌入向量。在获得句子中存在的每个单词的向量后,我将取句子中单词向量的平均值。这是我的代码:importnltkimportnumpyasnpfromnltkimportFreqDistfromnltk.corpusimportbrownnews=brown.words(categories='news')news_sents=brown.sents(categories='news')fdist=FreqDist(w.lower()forwinnews)vocabulary=[word

keil5软件报错 Error: L6406E: No space in execution regions with .ANY selector matching xxx

开发使用的MCUMCU:STM32G030C8T6,FLASH:64K,SRAM:8K;问题产生问题的背景是把一个STM32F103ZET6上的程序移植到了STM32G030C8T6上,由于STM32G030C8T6的SRAM大小不够产生报错。查看空间并进行分析首先查看程序占用了多少空间。移植后的程序由于无法通过编译,所以先查看移植前的程序。在编译结果栏里面可以看到,如下图所示。从编译信息可以看出,我们的代码占用FLASH大小为:12596字节(12234+362),所用的SRAM大小为:4632个字节(1192+3440)。编译结果里面的几个数据的意义:Code:表示程序所占用FLASH的大

python - 正则表达式 : How to access multiple matches of a group?

这个问题在这里已经有了答案:RegExwithmultiplegroups?(4个回答)关闭5年前。我正在组合一个相当复杂的正则表达式。表达式的一部分匹配诸如“+a”、“-57”等字符串。A+或a-后跟任意数量的字母或数字。我想匹配0个或多个匹配此模式的字符串。这是我想出的表达方式:([\+-][a-zA-Z0-9]+)*如果我要使用此模式搜索字符串“-56+a”,我希望得到两个匹配项:+a和-56但是,我只返回最后一个匹配项:>>>m=re.match("([\+-][a-zA-Z0-9]+)*",'-56+a')>>>m.groups()('+a',)查看python文档,我看到: