草庐IT

找单词

全部标签

python - 如何在 Django 模板中显示文本字段的前 50 个单词

我的Django模板中有这样一个字段:{{news.description}}我想显示该字段的前50个单词。我该怎么做? 最佳答案 来自thedocumentation:{{news.description|truncatewords:50}} 关于python-如何在Django模板中显示文本字段的前50个单词,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/7826955/

python - 在单词中查找连续的辅音

我需要能显示单词中连续辅音的代码。例如,对于"concertation",我需要获取["c","nc","rt","t","n"]。这是我的代码:defSuiteConsonnes(mot):consonnes=[]forxinmot:ifxin"bcdfghjklmnprstvyz":consonnes+=x+''returnconsonnes我设法找到了辅音,但我不知道如何连续找到它们。谁能告诉我我需要做什么? 最佳答案 您可以使用正则表达式,在remodule中实现更好的解决方案>>>re.findall(r'[bcdfghj

Python:使用 string.format() 将单词大写

是否可以使用字符串格式将单词大写?例如,"{user}didsuchandsuch.".format(user="foobar")应该返回“Foobar做了这样那样的事情。”请注意,我很清楚.capitalize();然而,这是我正在使用的(非常简化的)代码:printme=random.choice(["On{date},{user}didla-dee-dah.","{user}didla-dee-dahon{date}."])output=printme.format(user=x,date=y)如您所见,仅在.format()中将user定义为x.capitalize()是行不通

python - 使用在 python 中查找的字典修复带有空格的单词?

我从文档中提取了句子列表。我正在预处理这个句子列表以使其更合理。我面临以下问题我有这样的句子“morerecentlythedevelopment,whichisapotent”我想使用查找词典来更正这些句子?删除不需要的空格。最终输出应该是“最近的发展,这是一个强大的”我会假设这是预处理文本的直接任务吗?我需要一些帮助来寻找这样的方法。谢谢。 最佳答案 看看文字或文字segmentation.问题是找到将一个字符串最可能地拆分成一组单词的方法。示例:thequickbrownfoxjumpsoverthelazydog最有可能的分

python - 如何在 Python 中找到两个单词之间的最短依赖路径?

我尝试在给定依赖树的Python中找到两个单词之间的依赖路径。对于句子Robotsinpopularculturearetheretoremindusoftheawesomenessofunboundhumanagency.我使用practnlptools(https://github.com/biplab-iitb/practNLPTools)得到依赖解析结果如下:nsubj(are-5,Robots-1)xsubj(remind-8,Robots-1)amod(culture-4,popular-3)prep_in(Robots-1,culture-4)root(ROOT-0,ar

python - 如何使用 python 正则表达式查找和替换句子中第 n 次出现的单词?

仅使用python正则表达式,如何查找和替换句子中第n次出现的单词?例如:str='catgoosemousehorsepigcatcow'new_str=re.sub(r'cat',r'Bull',str)new_str=re.sub(r'cat',r'Bull',str,1)new_str=re.sub(r'cat',r'Bull',str,2)我上面有一个句子,其中“猫”这个词在句子中出现了两次。我想将第二次出现的“猫”更改为“公牛”,而第一个“猫”字保持不变。我的最后一句话看起来像:“猫鹅鼠马pig牛牛”。在我上面的代码中,我尝试了3次不同的时间无法得到我想要的。

python - 从字符串中删除单词的第一次出现?

我不熟悉正则表达式,如果有人使用正则表达式提供解决方案可以解释他们的语法,这样我就可以将其应用于future的情况,那就太好了。我有一个字符串(即'Description:Maryhadalittlelamb'),我想删除'Description:'这样该字符串就会读取'Maryhadalittlelamb,'但只是第一个实例,这样如果字符串是'Description:Description',则新字符串将是'说明。'有什么想法吗?谢谢! 最佳答案 Python的str.replace有一个最大替换参数。因此,在您的情况下,请执行以

python - 如何在不使用 num2word 库的情况下将数字转换为单词?

我需要将1-99中的数字转换为单词。这是我到目前为止得到的:num2words1={1:'One',2:'Two',3:'Three',4:'Four',5:'Five',\6:'Six',7:'Seven',8:'Eight',9:'Nine',10:'Ten',\11:'Eleven',12:'Twelve',13:'Thirteen',14:'Fourteen',\15:'Fifteen',16:'Sixteen',17:'Seventeen',18:'Eighteen',19:'Nineteen'}num2words2=['Twenty','Thirty','Forty','F

python - 如何在不使用空格作为单词分隔符的语言(如中文)上执行 Python split()?

我想将一个句子拆分成一个单词列表。对于英语和欧洲语言,这很简单,只需使用split()>>>"Thisisasentence.".split()['This','is','a','sentence.']但我还需要处理中文等不使用空格作为单词分隔符的语言的句子。>>>u"这是一个句子".split()[u'\u8fd9\u662f\u4e00\u4e2a\u53e5\u5b50']显然那是行不通的。如何将这样的句子拆分为单词列表?更新:到目前为止,答案似乎表明这需要自然语言处理技术,而且中文的词界是模糊的。我不确定我明白为什么。汉语中的边界这个词对我来说似乎非常明确。每个中文单词/字符都

python - 计算 Pandas 数据框中单词的频率

我有如下表格:URNFirm_Name0104472R.X.Yah&Co1104873BigBuildingSociety2109986StJames'sSociety3114058TheKensingtonSocietyLtd4113438MMVOilAssociatesLtd我想计算Firm_Name列中所有单词的频率,以获得如下输出:我试过下面的代码:importpandasaspdimportnltkdata=pd.read_csv("X:\Firm_Data.csv")top_N=20word_dist=nltk.FreqDist(data['Firm_Name'])prin