哈姆_草庐IT

今天继续给大家介绍Python相关知识，本文主要内容是Python英文词频统计程序示例，主要是对英文文本——《哈姆雷特》进行分词。一、英文文本词频统计思路想要对《哈姆雷特》进行英文单词词频统计，那么我们首先需要拿到《哈姆雷特》的原文，将之存储为本地的txt文档，然后使用Python打开该文件，读取里面的信息。在读取《哈姆雷特》内容后，我们首先需要将文件内容进行预处理，比如删除文件中的特殊符号，以及对文件内容进行全部小写的归一化操作等等。除此之外，我们还需要删除文档中所有的标点符号。之后，我们可以将文档使用split()函数，根据空格进行分隔，形成一个列表。之后，我们逐个取出列表中的元素，然后统