【python】词云图制作

虫本初阳 2023-05-12 原文

词云图制作 python

练了一段时间的词云图，就来和大家讲讲词云图制作的详细过程。

效果图

工具准备

1、python3
2、安装第三方库wordcloud
3、安装numpy、pillow库。
4、安装jieba库
5、安装matplotlib库

from wordcloud import WordCloud
import numpy as np
from PIL import Image
from matplotlib import colors
import collections
#这些都是需要使用的库

安装方法：我大多是借助pycharm中的setting直接安装。但是也有安装失败的，大家可以自行“c一下”

代码展示

# -*- coding: utf-8 -*-
import jieba
from wordcloud import WordCloud
import numpy as np
from PIL import Image
from matplotlib import colors
import collections


def chinese_jieba():
    # 读取目标文本
    with open(r'文本.txt', encoding='utf-8') as fp:
        txt = fp.read()
        fp.close()
    wordlist_jieba = jieba.lcut(txt) # 将文本分割，返回列表
    txt_jieba = " ".join(wordlist_jieba) # 将列表拼接为以空格为间断的字符串
    return txt_jieba
    
def stopwords_read():
    # 读取停用词，也可自己根据需求写入
    stopwords_ = ['里', '拍']
    with open('chinesestopwords.txt', 'r', encoding='utf-8') as f:
        for line in f:
            if len(line) > 0:
                stopwords_.append(line.strip())
    return stopwords_
    

def wordcloud_generate():
    stopwords_ = stopwords_read()#读取停用词
    txt = chinese_jieba()#读取文本
    background_image = np.array(Image.open('椭圆背景.jpg'))#自定义背景轮廓
    colormaps = colors.ListedColormap(['#871A84', '#BC0F6A', '#BC0F60', '#CC5F6A', '#AC1F4A'])  # 自定义字体色，该系列是蓝紫色
    wordcloud = WordCloud(font_path='simhei.ttf',  # 字体
                              prefer_horizontal=0.99,#大部分都是横向排放
                              background_color='white',  # 背景色
                              max_words=100,  # 显示单词数
                              max_font_size=400,  #最大字号
                              stopwords=stopwords_,  # 过滤噪声词
                              mask=background_image,#背景轮廓
                              colormap=colormaps,#使用自定义颜色
                              collocations=False
                              ).generate(txt)
    image = wordcloud.to_image()
    image.show()  # 展示图片
    wordcloud.to_file('词云图.jpg')  # 保存图片

if __name__ == '__main__':
    wordcloud_generate()

以上代码可直接运行
生成的图片可以去存放这个代码的文件夹下寻找

代码分析

基本运行条件：
首先是各种库都安装完毕；
其次将代码、目标文本、停用词文本、字体、背景图存放在同一个文件夹下（如果不存放在同一个文件夹下，就需要将代码中的资源引用路径改为绝对路径）如图:
文本
文本我是存储在txt文件中，具体信息来自微博上对智慧养老的关键字爬取，事实上，词云图也很好地体现了这一主题。
停用词
什么是停用词？
首先我们得清了解，在对文本进行分词后，可能会得到一些零散无用的词，有时候不利于文本主题的展现，比如“这个”，“那个”等，那么我们可以将这些词列入停用词中，图片上就不会展现这些词了。
词云图文字颜色
文字颜色有许多设置方法，这里采用自定义配色，这里送上我推荐的一些颜色集合供大家使用,经过我千挑万选，蛮好看的颜色

['#43045F', '#4E0362', '#C63264', '#FF9799', '#FFBAAB'] #紫色
['#7e9680', '#79616f', '#AE6378', '#D87F81', '#EAB595'] #杂色

其余参数
许多参数我在程序中均有注释，大家可以结合理解，根据自己的需要修改。
清晰度
如果是根据背景图片生成词云图，那么生成的词云图的清晰度是和背景图片一样的，背景图片是100100像素的，那么生成的词云图也是100100的，建议大家选取清晰度高的背景图片。

以下是本人的git地址，欢迎大家免费下载，交流学习：

https://github.com/HYHJessica/

python 词 span class token 开发语言 numpy

有关【python】词云图制作的更多相关文章

python - 如何使用 Ruby 或 Python 创建一系列高音调和低音调的蜂鸣声？ - 2
关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题？更新问题，以便editingthispost可以用事实和引用来回答它.关闭4年前。Improvethisquestion我想在固定时间创建一系列低音和高音调的哔哔声。例如:在150毫秒时发出高音调的蜂鸣声在151毫秒时发出低音调的蜂鸣声200毫秒时发出低音调的蜂鸣声250毫秒的高音调蜂鸣声有没有办法在Ruby或Python中做到这一点？我真的不在乎输出编码是什么(.wav、.mp3、.ogg等等)，但我确实想创建一个输出文件。
Python 相当于 Perl/Ruby ||= - 2
这个问题在这里已经有了答案:关闭10年前。PossibleDuplicate:Pythonconditionalassignmentoperator对于这样一个简单的问题表示歉意，但是谷歌搜索||=并不是很有帮助；)Python中是否有与Ruby和Perl中的||=语句等效的语句？例如:foo="hey"foo||="what"#assignfooifit'sundefined#fooisstill"hey"bar||="yeah"#baris"yeah"另外，类似这样的东西的通用术语是什么？条件分配是我的第一个猜测，但Wikipediapage跟我想的不太一样。
java - 什么相当于 ruby 的 rack 或 python 的 Java wsgi？ - 2
什么是ruby的rack或python的Java的wsgi？还有一个路由库。最佳答案来自Python标准PEP333:Bycontrast,althoughJavahasjustasmanywebapplicationframeworksavailable,Java's"servlet"APImakesitpossibleforapplicationswrittenwithanyJavawebapplicationframeworktoruninanywebserverthatsupportstheservletAPI.ht
华为OD机试用Python实现 -【明明的随机数】 2023Q1A - 2
华为OD机试题本篇题目：明明的随机数题目输入描述输出描述：示例1输入输出说明代码编写思路最近更新的博客华为od2023|什么是华为od，od薪资待遇，od机试题清单华为OD机试真题大全，用Python解华为机试题|机试宝典【华为OD机试】全流程解析+经验分享,题型分享,防作弊指南华为o
Unity 3D 制作开关门动画,旋转门制作,推拉门制作,门把手动画制作 - 2
Unity自动旋转动画1.开门需要门把手先动,门再动2.关门需要门先动,门把手再动3.中途播放过程中不可以再次进行操作觉得太复杂?查看我的文章开关门简易进阶版效果:如果这个门可以直接打开的话,就不需要放置"门把手"如果门把手还有钥匙需要旋转,那就可以把钥匙放在门把手的"门把手",理论上是可以无限套娃的可调整参数有:角度,反向,轴向,速度运行时点击Test进行测试自己写的代码比较垃圾,命名与结构比较拉,高手轻点喷,新手有类似的需求可以拿去做参考上代码usingSystem.Collections;usingSystem.Collections.Generic;usingUnityEngine;u
python - 如何读取 MIDI 文件、更改其乐器并将其写回？ - 2
我想解析一个已经存在的.mid文件，改变它的乐器，例如从“acousticgrandpiano”到“violin”，然后将它保存回去或作为另一个.mid文件。根据我在文档中看到的内容，该乐器通过program_change或patch_change指令进行了更改，但我找不到任何在已经存在的MIDI文件中执行此操作的库.他们似乎都只支持从头开始创建的MIDI文件。最佳答案 MIDIpackage会为您完成此操作，但具体方法取决于midi文件的原始内容。一个MIDI文件由一个或多个音轨组成，每个音轨是十六个channel中任何一个上的
「Python｜Selenium｜场景案例」如何定位iframe中的元素？ - 2
本文主要介绍在使用Selenium进行自动化测试或者任务时，对于使用了iframe的页面，如何定位iframe中的元素文章目录场景描述解决方案具体代码场景描述当我们在使用Selenium进行自动化测试的时候，可能会遇到一些界面或者窗体是使用HTML的iframe标签进行承载的。对于iframe中的标签，如果直接查找是无法找到的，会抛出没有找到元素的异常。比如近在咫尺的例子就是，CSDN的登录窗体就是使用的iframe，大家可以尝试通过F12开发者模式查看到的tag_name,class_name,id或者xpath来定位中的页面元素，会抛出NoSuchElementException异常。解决
动漫制作技巧如何制作动漫视频 - 2
动漫制作技巧是很多新人想了解的问题，今天小编就来解答与大家分享一下动漫制作流程，为了帮助有兴趣的同学理解，大多数人会选择动漫培训机构，那么今天小编就带大家来看看动漫制作要掌握哪些技巧？一、动漫作品首先完成草图设计和原型制作。设计草图要有目的、有对象、有步骤、要形象、要简单、符合实际。设计图要一致性，以保证制作的顺利进行。二、原型制作是根据设计图纸和制作材料，可以是手绘也可以是3d软件创建。在此步骤中，要注意的问题是色彩和平面布局。三、动漫制作制作完成后，加工成型。完成不同的表现形式后，就要对设计稿进行加工处理，使加工的难易度降低，并得到一些基本准确的概念，以便于后续的大样、准确的尺寸制定。四、
python ffmpeg 使用 pyav 转换一组图像到视频 - 2
2022/8/4更新支持加入水印水印必须包含透明图像，并且水印图像大小要等于原图像的大小pythonconvert_image_to_video.py-f30-mwatermark.pngim_dirout.mkv2022/6/21更新让命令行参数更加易用新的命令行使用方法pythonconvert_image_to_video.py-f30im_dirout.mkvFFMPEG命令行转换一组JPG图像到视频时，是将这组图像视为MJPG流。我需要转换一组PNG图像到视频，FFMPEG就不认了。pyav内置了ffmpeg库，不需要系统带有ffmpeg工具因此我使用ffmpeg的python包装p
Python 刷Leetcode题库，顺带学英语单词（31） - 2
ValidPalindromeGivenastring,determineifitisapalindrome,consideringonlyalphanumericcharactersandignoringcases. [#125]Example:"Aman,aplan,acanal:Panama"isapalindrome."raceacar"isnotapalindrome.Haveyouconsiderthatthestringmightbeempty?Thisisagoodquestiontoaskduringaninterview.Forthepurposeofthisproblem

【python】词云图制作

词云图制作 python

效果图

工具准备

代码展示

代码分析

以下是本人的git地址，欢迎大家免费下载，交流学习：

https://github.com/HYHJessica/

有关【python】词云图制作的更多相关文章

随机推荐