1. 程式人生 > >python使用wordcloud建立詞雲

python使用wordcloud建立詞雲

最近對詞雲比較感興趣,所以簡單學習了一下,希望這篇文章能對同樣想要學習詞雲的朋友有所幫助。本文用的是python實現詞雲的建立,當然也可以用詞雲生成器來生成。

模組安裝

這裡需要用到的模組有:wordcloud ,jieba,PIL,numpy,matplotlib

我電腦已安裝pip工具:pip install ‘xxx’

工程介紹

我這裡的測試檔案是:text.txt 裡邊存放的內容為百度百科對於蘋果公司的介紹。

背景圖片為蘋果創始人喬布斯:
這裡寫圖片描述

原始碼

下面附上原始碼,有註釋:

#!/user/local/bin/python2.7
# -*- coding:utf-8 -*-
#匯入所需要用到的模組 import matplotlib.pyplot as plt from wordcloud import WordCloud,ImageColorGenerator,STOPWORDS import jieba import numpy as np from PIL import Image #此處檔案路徑我用的是絕對路徑來獲取背景圖片及測試文字檔案 img = np.array(Image.open('C:/Users/ASUS1/Desktop/wordcloud/jobs.jpg')) text_from_file = open('C:/Users/ASUS1/Desktop/wordcloud/text.txt'
).read() #通過jieba分詞進行分詞並通過空格分割 Word_spilt_jieba = jieba.cut(text_from_file,cut_all = True) word_space = ' '.join(Word_spilt_jieba) #配置Wordcloud引數 my_wordcloud = WordCloud( background_color='white', #設定背景顏色 mask=img, #背景圖片 max_words = 200, #設定最大顯示的詞數 stopwords = STOPWORDS, #設定停用詞 #設定字型格式,字型格式 .ttf檔案需自己網上下載,最好將名字改為英文,中文名路徑載入會出現問題。
font_path = 'C:/Users/ASUS1/Desktop/wordcloud/simkai.ttf', max_font_size = 100, #設定字型最大值 random_state=50, #設定隨機生成狀態,即多少種配色方案 ).generate(word_space) #根據圖片生成詞雲顏色 iamge_colors = ImageColorGenerator(img) #my_wordcloud.recolor(color_func = iamge_colors) #顯示生成的詞雲圖片 plt.imshow(my_wordcloud) plt.axis('off') plt.show() #儲存生成的圖片,當關閉圖片時才會生效,中斷程式不會儲存 my_wordcloud.to_file('C:/Users/ASUS1/Desktop/wordcloud/dream.jpg')

結果:dream.jpg

這裡寫圖片描述

End………

相關推薦

python使用wordcloud建立

最近對詞雲比較感興趣,所以簡單學習了一下,希望這篇文章能對同樣想要學習詞雲的朋友有所幫助。本文用的是python實現詞雲的建立,當然也可以用詞雲生成器來生成。 模組安裝 這裡需要用到的模組有:wordcloud ,jieba,PIL,numpy,matplo

使用python3.6建立

先給大家介紹一些詞雲線上生成網站:國外網站WordItOut(https://worditout.com/)Tagxedo(http://www.tagxedo.com/)Tagul(https://w

】代碼

default rpo array ear strip() gray stop jieba pyplot 1 import sys 2 reload(sys) 3 sys.setdefaultencoding(‘utf-8‘) 4 5 from os

python生成

cloud arr 文本 [0 mas func word .text ges 期末復習比較忙過段時間來專門寫scrapy框架使用,今天介紹如何用python生成詞雲,雖然網上有很多詞雲生成工具,不過自己用python來寫是不是更有成就感。 今天要生成的是勵誌歌曲的詞雲,百

wordcloud類介紹&python制作詞雲圖&雲圖亂碼問題等小坑

fan ask 其中 文字 doesn 說明 bool 精神 則表達式 詞雲圖,大家一定見過,大數據時代大家經常見,我們今天就來用python的第三方庫wordcloud,來制作一個大數據詞雲圖,同時會降到這個過程中遇到的各種坑, 舉個例子,下面是我從自己的微信上抓的微信好

python爬蟲——京東評論、jieba分、wordcloud統計

nbsp cnblogs code utf-8 col type callback 結果 處理 接上一章,抓取京東評論區內容。 url=‘https://club.jd.com/comment/productPageComments.action?callback=fetc

python生成職業要求

經驗 asc matplot plot 數據 如圖所示 [] show print 接著上篇的說的,爬取了大數據相關的職位信息,http://www.17bigdata.com/jobs/。 # -*- coding: utf-8 -*- """ Created on T

中文詞頻統計及制作

print word 詞雲 出現 不能 分享 item 希望 技術 1.中軟國際華南區技術總監曾老師還會來上兩次課,同學們希望曾老師講些什麽內容?(認真想一想回答) 希望能講一些大數據相關內容,深入了解一下。 2.中文分詞 下載一中文長篇小說,並轉換成UTF-8編

+中文詞頻統計及制作9-25

輸出 很難 imp range 著名 python cloud 基本 jieba 1.我希望老師能講一點python在數據挖掘,數據分析領域的應用,最好能舉些實例,或者說帶我們實際操作一波。 2.中文分詞 下載一中文長篇小說,並轉換成UTF-8編碼 使用

Python的中文問題

white sim off rec 好的 tex 四川 輸入 clas 1 image= Image.open(‘F:/__identity/course/建模/九寨溝地震/四川地圖.jpg‘) 2 fig = plt.figure(figsize=(20, 16))

爬蟲+:爬取豆瓣電影top100的導演制作圖

ray 爬取 open tex 下載頁面 down app zhong form 前段時間做了一個關於豆瓣電影的爬蟲,之後又寫了一個陳奕迅歌詞的詞雲制作,於是我想不如做一個關於豆瓣高分電影導演的詞雲試試,於是有了接下來這篇隨筆。 首先,我需要知道豆瓣top100電影詳情頁面

用python爬取微博數據並生成

font 意思 extra 很多 返回 json 自己 技術分享 pre 很早之前寫過一篇怎麽利用微博數據制作詞雲圖片出來,之前的寫得不完整,而且只能使用自己的數據,現在重新整理了一下,任何的微博數據都可以制作出來,放在今天應該比較應景。 一年一度的虐汪節,是繼續蹲在角落默

Python 分析周傑倫《晴天》

保存 ron 語言 痛徹心扉 分析 near spa sim img 一、前言滿天星辰的夜晚,他們相遇了、、、夏天的時候,她慢慢的接近他,關心他,為他付出一切;秋天的時候,兩個人終於如願的在一起,分享一切快樂的時光但終究是快樂時光短暫,因為傑倫必須出國深造,兩人面臨了要分隔

Python 生成中文

images nag 塑造 中國國情 基礎 如果 jieba 和諧 進入 豆子無意中發現Python有個現成的模塊 word cloud可以根據文本文件生成詞雲,很好很強大,簡單地玩了一把。 寫代碼之前,首先需要安裝3個依賴的Python模塊,分別是matplotlib,

爬取網易音樂評論並使用展示

referer top readlines target ner ads 詞雲 pos 參考 最近聽到一首很喜歡的歌,許薇的《我以為》,評論也很有趣,遂有想爬取該歌曲下的所有評論並用詞雲工具展示。 我們使用chrome開發者工具,發現歌曲的評論都隱藏在以 R_S

關於爬取json內容生成(瘋狂踩坑)

.sh 動態 cnblogs google 插件 save result json數據 keys 本文爬取了掘金上關於前端前n頁的標題。將文章的標題進行分析,可以看出人們對前端關註的點或者近來的熱點。 導入庫 import requests import re from

python小白也可以分分鐘爬取微博數據,並生成有個性的,你get到了嗎?

python 爬蟲 web開發 編程Python(發音:英[?pa?θ?n],美[?pa?θɑ:n]),是一種面向對象、直譯式電腦編程語言,也是一種功能強大的通用型語言,已經具有近二十年的發展歷史,成熟且穩定。它包含了一組完善而且容易理解的標準庫,能夠輕松完成很多常見的任務。它的語法非常簡捷和清晰,與其它大多

用Python展示周董唱過的歌,發現內含秘密

結巴 ins TE bsp atp 實戰 mod 中文字庫 技術分享 馬上開始了,你準備好了麽 準備工作 環境:Windows + Python3.6 IDE:根據個人喜好,自行選擇 模塊: Matplotlib是一個 Python 的 2D數學繪圖庫 1 pip

繪制wordcloud

mage 文本 技術 iyu 讀取 頻率 字號 eight color wordcloud是優秀的第三方詞雲展示庫,該庫以空格為分割線,按照單詞出現的頻率自動設置字號與顏色實例如下 import wordcloud#詞雲庫 import jieba#分詞庫 a=open(

python(wordcloud)實現中文

bold pytho 作圖 back 垂直 背景 數值 內置 顯示 # 這是一個處理圖像的函數from scipy.misc import imreadfrom wordcloud import WordCloud,STOPWORDS,ImageColorGenerat