草庐IT

找单词

全部标签

python - 如何显示所有包含这些字符的单词?

我有一个文本文件,我想显示所有同时包含z和x字符的单词。我该怎么做? 最佳答案 如果你不想有两个问题:forwordinfile('myfile.txt').read().split():if'x'inwordand'z'inword:printword 关于python-如何显示所有包含这些字符的单词?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/3962846/

python - 如何标记没有空格分隔符的连续单词?

我将Python与nltk结合使用。我需要处理一些没有空格的英文文本,但是nltk中的word_tokenize函数无法处理这样的问题。那么如何在没有任何空格的情况下标记文本。Python有什么工具吗? 最佳答案 我不知道有这样的工具,但你的问题的解决方案取决于语言。对于土耳其语,您可以逐个字母扫描输入文本并将字母累积成一个词。当您确定累积的单词形成字典中的有效单词时,您将其保存为单独的标记,删除用于累积新单词的缓冲区并继续该过程。您可以针对英语尝试这样做,但我假设您可能会发现某个单词的结尾可能是某个字典单词的开头,这会给您带来一些

python - 计算单词中的音节数

我是初学者,我有一个问题需要帮助。这是家庭作业,因此不胜感激任何提示。我已经看到了一些类似的主题,但答案超出了我所知道的范围......作为大型程序的一部分,我需要计算文本文件中的音节数。除了音节,我已经得到了我需要的一切。我尝试了几种不同的方法,但并不总能捕捉到特殊情况。我应该“计算相邻元音组的数量,不包括单词末尾的‘e’。”我明白这意味着什么,但我无法在我的程序中正确使用它。这是我的:::defsyllables(word):syl=0vowels='aeiouy'starts=['ou','ei','ae','ea','eu','oi']endings=['es','ed','e

python - 什么时候应该在 Python 函数名称中的单词之间使用下划线(根据样式指南)?

styleguide说应该使用下划线,但许多Python内置函数不使用。下划线的标准应该是什么?我想与Python风格指南保持一致,但这方面似乎有点模糊。是否有好的经验法则,是基于我自己的判断,还是这两种方式都无关紧要?例如,我应该将我的函数命名为isfoo()以匹配旧函数,还是应该将其命名为is_foo()以匹配样式指南? 最佳答案 风格指南将此留给您:Functionnamesshouldbelowercase,withwordsseparatedbyunderscoresasnecessarytoimprovereadabil

python - 用 python 解决困惑的单词拼图?

我有一个有趣的编程难题给你:你会得到两样东西:包含一系列英语单词的单词,例如:word="iamtiredareyou"可能的子集:subsets=['i','a','am','amt','m','t','ti','tire','tired','i','ire','r','re','red','redare','e','d','da','dar','dare','a','ar','are','r','re','e','ey','y','yo','you','o','u']挑战:Level-1:我需要务实地找到子集中的成员,这些成员按顺序组合在一起将构成"iamtiredareyou"即

python - 在字符串中查找字符/单词的周围句子

我正在尝试使用python从包含给定子字符串的字符串中获取句子。我可以访问字符串(学术摘要)和带有开始和结束索引的亮点列表。例如:{abstract:"...longabstracthere..."highlights:[{concept:'aword',start:1,end:10}{concept:'cancer',start:123,end:135}]}我遍历每个突出显示,在摘要中找到它的起始索引(结束并不重要,因为我只需要在句子中找到一个位置),然后以某种方式需要识别索引出现在的句子.我能够使用nltk.tonenize.sent_tokenize将摘要标记化为句子,但这样做会

Python正则表达式来替换除特定单词之外的所有内容

我正在尝试使用正则表达式执行以下操作:importrex=re.compile('[^(going)|^(you)]')#wordstoreplaces='Iamgoinghomenow,thankyou.'#stringtomodifyprintre.sub(x,'_',s)我得到的结果是:'_____going__o___no______n__you_'我想要的结果是:'_____going_________________you_'由于^只能在方括号[]内使用,所以这个结果是有道理的,但我不确定还有什么办法可以解决。我什至尝试过'([^g][^o][^i][^n][^g])|([

python - 列表中最长单词的长度

获取最长单词的长度的更pythonic方法是什么:len(max(words,key=len))或者:max(len(w)forwinwords)或者..别的什么?words是一个字符串列表。我发现我需要经常这样做,并且在使用几个不同的样本大小进行计时后,第一种方法似乎始终更快,尽管表面上看起来效率较低(len的冗余被调用两次似乎没关系-在这种形式的C代码中会发生更多事情吗?)。 最佳答案 虽然:max(len(w)forwinwords)是否更容易“阅读”——您有生成器的开销。同时:len(max(words,key=len))可

python - Pandas:检查系列 A 中的单词是否以系列 B 中的一个单词结尾的最快方法

我想检查名为strings的系列中的单词是否以系列ending_strings中的一个单词结尾。strings=Series(['om','foo_nom','nom','bar_foo','foo','blah'])ending_strings=Series(['nom','foo'])expected_results=Series([False,True,True,True,True,False])我想出了以下代码,但是否有更快或更pandas风格的方法来做到这一点?frompandasimportSeriesdefew(v):returnstrings.str.endswith(