wordcloud是优秀的词云展示第三方库-词云以词语为基本单位,更加直观和艺术地展示文本
通过词云,我们可以快速提取大段文本的重要信息.
体验一下:
#直接输出
import jieba
from wordcloud import WordCloud
import matplotlib.pyplot as plt
from imageio import imread
from collections import Counter
txt = 'word_cloud是python的一个三方库,称为词云也叫做文字云,是根据文本中的词频,\
对内容进行可视化的汇总.安装word_cloud可以使用python自带的pip工具来进行,\
首先确保已经安装python与pip并且pip以及更新到最新版本.word_cloud依赖于numpy与pillow,\
当然如果只想将图像保存成图片文件,使用matplotlib库代替也可以,此处索性就将三个库都安装好.'
words = [x for x in jieba.cut(txt) if len(x) >= 2]
words = ' '.join(words)
ordcloud = WordCloud(font_path='simhei.ttf', background_color='white').generate(words)
plt.imshow(wordcloud)
plt.axis('off')
plt.show()
先show一下
#加背景图
mask = imread('python.png')
wordcloud = WordCloud(font_path='simhei.ttf', background_color='white',mask = mask).generate(words)
plt.imshow(wordcloud)
plt.axis('off')
plt.show()
背景图
#利用词频show
frequencies = Counter(words).most_common()
frequencies=dict(frequencies)
mask = imread('python.png')
wordcloud = WordCloud(font_path='simhei.ttf', background_color='white', max_words=100, mask=mask).fit_words(
frequencies)
plt.imshow(wordcloud)
plt.axis('off')
plt.show()
利用词频
get it.