1. 程式人生 > >詞雲分析《天龍八部》人物出現次數

詞雲分析《天龍八部》人物出現次數

出現次數 標題 http 春秋 mar -s pen image 背景圖片

一.需要的三方庫

1.安裝詞雲:

  pip install wordcloud

2.安裝結巴

  pip install jieba

3.安裝matplotlib

  pip install matplotlib

二.實現代碼

 1 import jieba # 分詞函數
 2 from scipy.misc import imread  # 這是一個處理圖像的函數
 3 from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator
 4 import matplotlib.pyplot as plt # 分析數據的函數
 5
6 file_apath = open(tlbb.txt,r,encoding=UTF-8).read() # 打開文件 7 bg_pic = imread(map.jpg) # 圖片路徑 8 9 # 王語嫣, 慕容復, 木婉清, 遊坦之, 鳩摩智, 段延慶,包不同, 丁春秋, 阿紫, 阿朱, 段正淳, 鐘萬洪, 風波惡, 天山童姥, 耶律洪基........... 10 11 jieba.add_word(喬峰) # 添加關鍵詞 12 jieba.add_word(段譽) 13 jieba.add_word(虛竹) 14 15 jieba.add_word(
王語嫣) 16 jieba.add_word(慕容復) 17 jieba.add_word(木婉清) 18 jieba.add_word(段正淳) 19 jieba.add_word(鳩摩智) 20 jieba.add_word(遊坦之) 21 jieba.add_word(包不同) 22 jieba.add_word(鐘萬洪) 23 jieba.add_word(耶律洪基) 24 jieba.add_word(蕭峰) 25 jieba.add_word(南海惡神) 26 jieba.add_word(阿朱) 27 jieba.add_word(鐘靈
) 28 jieba.add_word(阿碧) 29 jieba.add_word(阿紫) 30 jieba.add_word(玄慈) 31 32 33 34 35 wordlist_jieba = jieba.cut(file_apath, cut_all = True) # 使用jieba分詞 36 world_split = " ".join(wordlist_jieba) # 分詞後的數據 37 38 39 my_wordcloud = WordCloud(background_color=white, # 設置背景色 40 max_font_size=50, # 字體大小 41 width=2100, height=1400,margin=2, # 圖片的寬,高,和邊距 42 mask=bg_pic, # 設置背景圖片 43 font_path="C:/Windows/Fonts/simhei.ttf"# 設置字體路徑 44 # random_state=42, 45 ) 46 # 屏蔽關鍵詞 47 stopwords=STOPWORDS.add(自己) 48 stopwords=STOPWORDS.add(說道) 49 stopwords=STOPWORDS.add(什麽) 50 stopwords=STOPWORDS.add(他們) 51 stopwords=STOPWORDS.add(一個) 52 stopwords=STOPWORDS.add(不是) 53 stopwords=STOPWORDS.add(便是) 54 stopwords=STOPWORDS.add(甚麽) 55 stopwords=STOPWORDS.add(不知) 56 stopwords=STOPWORDS.add(咱們) 57 stopwords=STOPWORDS.add(我們) 58 stopwords=STOPWORDS.add(可是) 59 stopwords=STOPWORDS.add(只是) 60 stopwords=STOPWORDS.add(如此) 61 stopwords=STOPWORDS.add(這些) 62 stopwords=STOPWORDS.add(倘若) 63 stopwords=STOPWORDS.add(怎麽) 64 stopwords=STOPWORDS.add(這麽) 65 66 67 my_wordcloud.generate(world_split) # 生成詞雲 68 image_colors = ImageColorGenerator(bg_pic) # 轉換字體主題色與圖片一致 69 # 繪制詞雲 70 plt.figure() 71 plt.imshow(my_wordcloud.recolor(color_func=image_colors)) 72 plt.title(Word Cloud) # 詞雲標題 73 plt.axis("off") # 關閉詞雲 74 plt.show() # 顯示生成的詞雲圖片 75 my_wordcloud.to_file(ciyun.png) # 保存圖片

三.實現效果

技術分享圖片

  

詞雲分析《天龍八部》人物出現次數