用户注册



邮箱:

密码:

用户登录


邮箱:

密码:
记住登录一个月忘记密码?

发表随想


还能输入:200字
云代码 - python代码库

提取词频,制作词频云图

2020-10-13 作者:tcmans举报

[python]代码库

import jieba
import matplotlib as mpl
import matplotlib.pyplot as plt
from wordcloud import WordCloud

#输出词频
#文件夹位置
txt = r"C:\Users\hua'wei\Desktop\zt\text.txt"
txt1 = open(txt,"rb").read()#文件夹位置
words = jieba.lcut(txt1)
counts = {}
for word in words:
    if len(word) == 1:
        continue
    else:
        counts[word] = counts.get(word,0) + 1
items = list(counts.items())
items.sort(key=lambda x:x[1],reverse=True)
for i in range(10):
    word,count= items[i]
    print("{0:<10}{1:>5}".format(word,count))

#打印云图
#定义一个空字符串
final = ""
#txt = r"C:\Users\hua'wei\Desktop\zt\text.txt"
#打开文件夹,读取内容,并进行分词
with open(txt,'r',encoding = 'utf-8') as f:
    for line in f.readlines():
        word = jieba.cut(line)
        for i in word:
            final = final + i +" "
##图云打印
word_pic = WordCloud(
    #设置背景颜色
    background_color='white',
    #设置最大显示词云数
    max_words=500,
    #设置字体
    font_path = r'C:\Windows\Fonts\simkai.ttf',
    width = 2000,
    height = 1000,
    #设置字体最大值
    max_font_size=300,
    # 设置有多少种随机生成状态,即有多少种配色方案
    random_state=100
).generate(final)
plt.imshow(word_pic)
#去掉坐标轴
plt.axis('off')
#保存图片到相应文件夹
plt.savefig(r"C:\Users\hua'wei\Desktop\zt\zt.png")


分享到:
更多

网友评论    (发表评论)


发表评论:

评论须知:

  • 1、评论每次加2分,每天上限为30;
  • 2、请文明用语,共同创建干净的技术交流环境;
  • 3、若被发现提交非法信息,评论将会被删除,并且给予扣分处理,严重者给予封号处理;
  • 4、请勿发布广告信息或其他无关评论,否则将会删除评论并扣分,严重者给予封号处理。