資料視覺化:折線圖--直方圖--散點圖
阿新 • • 發佈:2018-11-19
import matplotlib.pyplot as plt -- 繪製2D折線圖,直方圖,散點圖等
import numpy as np -- 將列表轉換為陣列,給圖形上每個點新增標籤時會用到
import pygal -- pygal是一個SVG圖表庫。SVG是一種向量圖格式,全稱Scalable Vector Graphics -- 可縮放向量圖形。
from random import choice -- 生成隨機漫步資料,函式choice([])從列表中隨機輸出一個數
from random import randint --randint()從一個區間隨機返回一個數
1、折線圖
plt.plot() 繪製折線圖
np.array() 將列表轉換為儲存單一資料型別的多維陣列,例如[1 2 3 4 5]
zip(x,y) 函式用於將可迭代的物件作為引數,將物件中對應的元素打包成一個個元組,然後返回由這些元組組成的物件,
這樣做的好處是節約了不少的記憶體。我們可以使用 list() 轉換來輸出列表。如果各個迭代器的元素個數不一致,
則返回列表長度與最短的物件相同,利用*號操作符,可以將元組解壓為列表,例如a1,a2 = zip(*zip(a,b))。
plt.annotate() 給折線點設定(x,y)座標值
plt.tick_params() 設定刻度線和標籤的大小,顏色,內外側,both代表xy同時設定
plt.title()設定圖表標題
plt.xlabel() 設定X軸標籤
plt.ylabel() 設定Y軸標籤
plt.axis([]) 設定X,Y軸刻度的取值範圍
plt.savefig('') 儲存圖表為圖片格式
plt.show() 開啟matplotlib檢視器,並顯示繪製的圖形
#模組pyplot包含很多生成圖表的函式 import matplotlib.pyplot as plt import numpy as np input_values = [1,2,3,4,5,6] squares = [1,4,9,16,25,36] #plot()繪製折線圖plt.plot(input_values,squares,linewidth=5,color='m') #np.array()將列表轉換為儲存單一資料型別的多維陣列 x = np.array(input_values) y = np.array(squares) #annotate()給折線點設定座標值 for a,b in zip(x,y): plt.annotate('(%s,%s)'%(a,b),xy=(a,b),xytext=(-25,15), textcoords='offset points') #設定標題 plt.title('Square Numbers',fontsize=24) plt.xlabel('Value',fontsize=14) plt.ylabel('Square of Value',fontsize=14) #設定刻度線和標籤的大小,顏色,內外側,both代表xy同時設定 plt.tick_params(axis='both',direction='in',colors='c',labelsize=14) plt.axis([0,8,0,45]) plt.savefig('images\line_chart.png') #show()開啟matplotlib檢視器,並顯示繪製的圖形 plt.show()
2、直方圖
plt.bar() 繪製直方圖
plt.text() 給條形柱新增標籤
import numpy as np import matplotlib.pyplot as plt #建立帶數字標籤的直方圖 numbers = list(range(1,11)) x = np.array(numbers) y = np.array([a**2 for a in numbers]) #繪製圖形 plt.bar(x,y,width=0.5,align='center',color='c') plt.title('Square Numbers',fontsize=24) plt.xlabel('Value',fontsize=14) plt.ylabel('Square of Value',fontsize=14) plt.tick_params(axis='both',labelsize=14) #設定xy軸座標取值範圍 plt.axis([0,11,0,110]) #設定標籤,a,b代表標籤的座標,第二個為標籤內容,然後是對齊方式和尺寸 for a,b in zip(x,y): plt.text(a,b+0.1,'%.0f'%b,ha = 'center',va = 'bottom',fontsize=7) plt.savefig('images\squares.png') plt.show()
3、散點圖
plt.scatter() 繪製散點圖
#scatter()繪製散點圖 import matplotlib.pyplot as plt x_values = list(range(1,11)) y_values = [x**2 for x in x_values] #引數c為點的顏色,預設藍色;edgecolor為點的輪廓顏色,預設黑色,none為無色 plt.scatter(x_values,y_values,c='white',edgecolor='green',s=1000) ''' 還可以使用RGB模式,向引數c傳遞一個元組,包含三個0-1之間的小數, 他們分別代表紅綠藍的份量,越接近0,顏色越深,越接近1,顏色越淺 c=(0,0,0.8),代表淡藍色 ''' #設定標題 plt.title('Square Numbers',fontsize=24) plt.xlabel('Value',fontsize=14) plt.ylabel('Square of Value',fontsize=14) #設定刻度的大小,both代表xy同時設定 plt.tick_params(axis='both',labelsize=14) #設定座標軸的取值範圍 plt.axis([0,11,-20,110]) #plt.savefig('images\squares_plot1.png') plt.show()
4、顏色對映(colormap)是一系列顏色,從起始顏色漸變到結束顏色。
#根據每個點的Y值來設定顏色對映 x_values = list(range(1,11)) y_values = [x**2 for x in x_values] '''引數c設定成Y值列表,代表各點的先後順序,使用引數camp告訴 pyplot使用什麼顏色對映,s為點的大小 ''' plt.scatter(x_values,y_values,c=y_values,cmap=plt.cm.Reds, edgecolor='green',s=1000) plt.title('Square Numbers',fontsize=24) plt.xlabel('Value',fontsize=14) plt.ylabel('Square of Value',fontsize=14) plt.tick_params(axis='both',labelsize=14) plt.axis([0,11,-20,110]) #savefig()自動儲存圖表,第二個引數表示刪除圖表多餘的空白區域 plt.savefig('images\squares_plot2.png',bbox_inches='tight') plt.show()
5、pygal.Bar() 可縮放的直方圖
randint(1,5) 從一個區間隨機返回一個數,包括兩端的數
hist = pygal.Bar() 定義直方圖類
hist.x_labels=[] 設定X軸刻度
hist.x_title='' X軸標題
hist.y_title='' Y軸標題
hist.add(' ',[]) 繪製直方圖,''內為圖表標題
hist.render_to_file('') 儲存到資料夾
#pygal模組:建立可縮放的向量圖形檔案(.svg) import pygal from random import randint class Die(): def __init__(self,num_sides=6): self.num_sides = num_sides def roll(self): '''函式randint()返回一個區間的任意數值''' return randint(1,self.num_sides) #建立一個6面骰子,搖1000次,將結果存在列表中 die_1 = Die() die_2 = Die(10) results = [die_1.roll() + die_2.roll() for roll_num in range(5000)] #分析每一種結果的出現頻率,存在一個列表中 max_result = die_1.num_sides + die_2.num_sides frequencies = [results.count(value) for value in range(2,max_result+1)] #對結果進行視覺化,hist:頻數直方圖 hist = pygal.Bar() hist.x_labels = list(range(2,max_result+1,1))#x軸刻度 hist.x_title = 'Result' # 標題 hist.y_title = 'Freqency of Rsult' #add()向它傳遞一個指定的標籤,一個列表,包含將出現在圖表中的值 hist.add('D6 + D10',frequencies) hist.render_to_file('images\hist.svg')
6、隨機漫步
choice([])從列表中隨機輸出一個數
figure()用於指定圖表的寬度、高度、解析度和背景色,形參figsize需要指定一個元組,單位為英寸,dpi為解析度,facecolor為視窗邊框顏色
plt.axes().get_xaxis().set_visible(False) 隱藏座標軸
line = pygal.Line() 繪製可縮放的折線圖
import matplotlib.pyplot as plt import pygal from random import choice class RandomWalk(): '''一個生成隨機漫步資料的類''' def __init__(self,num_points): self.num_points = num_points #所有的隨機漫步都始於(0,0) self.x_values = [0] self.y_values = [0] def get_step(self): direction = choice([1, -1]) # 隨機選擇向左向右兩個方向 distance = choice([0, 1, 2, 3, 4, 5, 6, 7, 8]) # 隨機選擇移動的距離 return direction * distance # 每次移動的步長 def fill_walk(self): '''定義一個迴圈,直到達到給定的點數''' while len(self.x_values) < self.num_points: x_step = self.get_step() y_step = self.get_step() #拒絕原地踏步 if x_step and y_step == 0: continue #計算下一個點的xy值,用列表的最後一個值加上步長 next_x = self.x_values[-1] + x_step next_y = self.y_values[-1] + y_step self.x_values.append(next_x) self.y_values.append(next_y) rw = RandomWalk(5000) rw.fill_walk() #繪製特定視窗尺寸和解析度的隨機漫步散點圖 plt.figure(figsize=(6,6),dpi=128,facecolor='palegreen') point_numbers = list(range(rw.num_points)) #以顏色對映的方式展示出來,可以看出漫步中各點的先後順序 plt.scatter(rw.x_values,rw.y_values,c=point_numbers, cmap=plt.cm.Greens,edgecolor='none',s=1) #重新繪製第一個和最後一個點,突出顯示 plt.scatter(0,0,c='red',edgecolors='none',s=100) plt.scatter(rw.x_values[-1],rw.y_values[-1],c='orange', edgecolors='none',s=100) #exes()隱藏座標軸 plt.axes().get_xaxis().set_visible(False) plt.axes().get_yaxis().set_visible(False) #plt.savefig(r'images\random_plot1.png') plt.show() '''生成隨機漫步折線圖''' rw = RandomWalk(5000) rw.fill_walk() plt.plot(rw.x_values,rw.y_values,color='cyan',linewidth=1) plt.axes().get_xaxis().set_visible(False) plt.axes().get_yaxis().set_visible(False) plt.show() '''利用pygal實現隨機漫步折線圖''' lc = RandomWalk(5000) lc.fill_walk() line_chart = pygal.Line() line_chart.x_labels = map(str, range(0, 9)) line_chart.add('random',lc.y_values) line_chart.render_to_file(r'images\random.svg')