python使用wordcloud建立詞雲
最近對詞雲比較感興趣,所以簡單學習了一下,希望這篇文章能對同樣想要學習詞雲的朋友有所幫助。本文用的是python實現詞雲的建立,當然也可以用詞雲生成器來生成。
模組安裝
這裡需要用到的模組有:wordcloud ,jieba,PIL,numpy,matplotlib
我電腦已安裝pip工具:pip install ‘xxx’
工程介紹
我這裡的測試檔案是:text.txt 裡邊存放的內容為百度百科對於蘋果公司的介紹。
背景圖片為蘋果創始人喬布斯:
原始碼
下面附上原始碼,有註釋:
#!/user/local/bin/python2.7
# -*- coding:utf-8 -*-
#匯入所需要用到的模組
import matplotlib.pyplot as plt
from wordcloud import WordCloud,ImageColorGenerator,STOPWORDS
import jieba
import numpy as np
from PIL import Image
#此處檔案路徑我用的是絕對路徑來獲取背景圖片及測試文字檔案
img = np.array(Image.open('C:/Users/ASUS1/Desktop/wordcloud/jobs.jpg'))
text_from_file = open('C:/Users/ASUS1/Desktop/wordcloud/text.txt' ).read()
#通過jieba分詞進行分詞並通過空格分割
Word_spilt_jieba = jieba.cut(text_from_file,cut_all = True)
word_space = ' '.join(Word_spilt_jieba)
#配置Wordcloud引數
my_wordcloud = WordCloud(
background_color='white', #設定背景顏色
mask=img, #背景圖片
max_words = 200, #設定最大顯示的詞數
stopwords = STOPWORDS, #設定停用詞
#設定字型格式,字型格式 .ttf檔案需自己網上下載,最好將名字改為英文,中文名路徑載入會出現問題。
font_path = 'C:/Users/ASUS1/Desktop/wordcloud/simkai.ttf',
max_font_size = 100, #設定字型最大值
random_state=50, #設定隨機生成狀態,即多少種配色方案
).generate(word_space)
#根據圖片生成詞雲顏色
iamge_colors = ImageColorGenerator(img)
#my_wordcloud.recolor(color_func = iamge_colors)
#顯示生成的詞雲圖片
plt.imshow(my_wordcloud)
plt.axis('off')
plt.show()
#儲存生成的圖片,當關閉圖片時才會生效,中斷程式不會儲存
my_wordcloud.to_file('C:/Users/ASUS1/Desktop/wordcloud/dream.jpg')
結果:dream.jpg
End………
相關推薦
python使用wordcloud建立詞雲
最近對詞雲比較感興趣,所以簡單學習了一下,希望這篇文章能對同樣想要學習詞雲的朋友有所幫助。本文用的是python實現詞雲的建立,當然也可以用詞雲生成器來生成。 模組安裝 這裡需要用到的模組有:wordcloud ,jieba,PIL,numpy,matplo
使用python3.6建立詞雲
先給大家介紹一些詞雲線上生成網站:國外網站WordItOut(https://worditout.com/)Tagxedo(http://www.tagxedo.com/)Tagul(https://w
【詞雲】代碼
default rpo array ear strip() gray stop jieba pyplot 1 import sys 2 reload(sys) 3 sys.setdefaultencoding(‘utf-8‘) 4 5 from os
python生成詞雲
cloud arr 文本 [0 mas func word .text ges 期末復習比較忙過段時間來專門寫scrapy框架使用,今天介紹如何用python生成詞雲,雖然網上有很多詞雲生成工具,不過自己用python來寫是不是更有成就感。 今天要生成的是勵誌歌曲的詞雲,百
詞雲wordcloud類介紹&python制作詞雲圖&詞雲圖亂碼問題等小坑
fan ask 其中 文字 doesn 說明 bool 精神 則表達式 詞雲圖,大家一定見過,大數據時代大家經常見,我們今天就來用python的第三方庫wordcloud,來制作一個大數據詞雲圖,同時會降到這個過程中遇到的各種坑, 舉個例子,下面是我從自己的微信上抓的微信好
python爬蟲——京東評論、jieba分詞、wordcloud詞雲統計
nbsp cnblogs code utf-8 col type callback 結果 處理 接上一章,抓取京東評論區內容。 url=‘https://club.jd.com/comment/productPageComments.action?callback=fetc
python生成職業要求詞雲
經驗 asc matplot plot 數據 如圖所示 [] show print 接著上篇的說的,爬取了大數據相關的職位信息,http://www.17bigdata.com/jobs/。 # -*- coding: utf-8 -*- """ Created on T
中文詞頻統計及詞雲制作
print word 詞雲 出現 不能 分享 item 希望 技術 1.中軟國際華南區技術總監曾老師還會來上兩次課,同學們希望曾老師講些什麽內容?(認真想一想回答) 希望能講一些大數據相關內容,深入了解一下。 2.中文分詞 下載一中文長篇小說,並轉換成UTF-8編
+中文詞頻統計及詞雲制作9-25
輸出 很難 imp range 著名 python cloud 基本 jieba 1.我希望老師能講一點python在數據挖掘,數據分析領域的應用,最好能舉些實例,或者說帶我們實際操作一波。 2.中文分詞 下載一中文長篇小說,並轉換成UTF-8編碼 使用
Python詞雲的中文問題
white sim off rec 好的 tex 四川 輸入 clas 1 image= Image.open(‘F:/__identity/course/建模/九寨溝地震/四川地圖.jpg‘) 2 fig = plt.figure(figsize=(20, 16))
爬蟲+詞雲:爬取豆瓣電影top100的導演制作圖雲
ray 爬取 open tex 下載頁面 down app zhong form 前段時間做了一個關於豆瓣電影的爬蟲,之後又寫了一個陳奕迅歌詞的詞雲制作,於是我想不如做一個關於豆瓣高分電影導演的詞雲試試,於是有了接下來這篇隨筆。 首先,我需要知道豆瓣top100電影詳情頁面
用python爬取微博數據並生成詞雲
font 意思 extra 很多 返回 json 自己 技術分享 pre 很早之前寫過一篇怎麽利用微博數據制作詞雲圖片出來,之前的寫得不完整,而且只能使用自己的數據,現在重新整理了一下,任何的微博數據都可以制作出來,放在今天應該比較應景。 一年一度的虐汪節,是繼續蹲在角落默
Python 詞雲分析周傑倫《晴天》
保存 ron 語言 痛徹心扉 分析 near spa sim img 一、前言滿天星辰的夜晚,他們相遇了、、、夏天的時候,她慢慢的接近他,關心他,為他付出一切;秋天的時候,兩個人終於如願的在一起,分享一切快樂的時光但終究是快樂時光短暫,因為傑倫必須出國深造,兩人面臨了要分隔
Python 生成中文詞雲
images nag 塑造 中國國情 基礎 如果 jieba 和諧 進入 豆子無意中發現Python有個現成的模塊 word cloud可以根據文本文件生成詞雲,很好很強大,簡單地玩了一把。 寫代碼之前,首先需要安裝3個依賴的Python模塊,分別是matplotlib,
爬取網易雲音樂評論並使用詞雲展示
referer top readlines target ner ads 詞雲 pos 參考 最近聽到一首很喜歡的歌,許薇的《我以為》,評論也很有趣,遂有想爬取該歌曲下的所有評論並用詞雲工具展示。 我們使用chrome開發者工具,發現歌曲的評論都隱藏在以 R_S
關於爬取json內容生成詞雲(瘋狂踩坑)
.sh 動態 cnblogs google 插件 save result json數據 keys 本文爬取了掘金上關於前端前n頁的標題。將文章的標題進行分析,可以看出人們對前端關註的點或者近來的熱點。 導入庫 import requests import re from
python小白也可以分分鐘爬取微博數據,並生成有個性的詞雲,你get到了嗎?
python 爬蟲 web開發 編程Python(發音:英[?pa?θ?n],美[?pa?θɑ:n]),是一種面向對象、直譯式電腦編程語言,也是一種功能強大的通用型語言,已經具有近二十年的發展歷史,成熟且穩定。它包含了一組完善而且容易理解的標準庫,能夠輕松完成很多常見的任務。它的語法非常簡捷和清晰,與其它大多
用Python詞雲展示周董唱過的歌,發現內含秘密
結巴 ins TE bsp atp 實戰 mod 中文字庫 技術分享 馬上開始了,你準備好了麽 準備工作 環境:Windows + Python3.6 IDE:根據個人喜好,自行選擇 模塊: Matplotlib是一個 Python 的 2D數學繪圖庫 1 pip
詞雲繪制wordcloud
mage 文本 技術 iyu 讀取 頻率 字號 eight color wordcloud是優秀的第三方詞雲展示庫,該庫以空格為分割線,按照單詞出現的頻率自動設置字號與顏色實例如下 import wordcloud#詞雲庫 import jieba#分詞庫 a=open(
python(wordcloud)實現中文詞雲
bold pytho 作圖 back 垂直 背景 數值 內置 顯示 # 這是一個處理圖像的函數from scipy.misc import imreadfrom wordcloud import WordCloud,STOPWORDS,ImageColorGenerat