1. 程式人生 > >利用Python進行資料分析【01】-資料型別及結構

利用Python進行資料分析【01】-資料型別及結構

Python資料型別詳解

Python基本資料型別一般分為:數字、字串、列表、元組、字典、集合這六種基本資料型別。下面分別來介紹這幾種資料型別基本用法。

目錄

  1. 數字—>int 類
  2. 字串 —>str類
  3. 列表—>list類
  4. 元組—>tuple類
  5. 字典—>dict類
  6. 集合—>set類

正文

1.數字—>int 類

對於數字,Python3支援int整型、float浮點數、complex複數以及bool布林值(0和1)。

資料型別 Python表示 示例
整型 int 3
浮點數 float 10.2
複數 complex True
布林值 bool 4+3j

(1)整型 Python中的整型就是數學中的整數,當然,也包括負整數。Python內部對整數的處理分為普通整數和長整數,普通整數長度為機器位長,通常都是32位,超過這個範圍的整數就自動當長整數處理,而長整數的範圍幾乎完全沒限制。 (2)浮點數 Python的浮點數就是數學中的小數,在運算中,整數與浮點數運算的結果是浮點數 。整數和浮點數在計算機內部儲存的方式是不同的,整數運算永遠是精確的,而浮點數運算則可能會有四捨五入的誤差。 (3)複數 複數是由一個實數和一個虛陣列成,表示為x+yj,其中x是實數部分,y是虛數部分。實數部分和虛數部分都是浮點數。

#coding=utf8

>>>
aa = 123-12j >>>print(aa.real) #output實數部分123.0 123.0 >>>print(aa.imag) #output虛數部分-12.0 -12.0

(4)布林值 在Python中,None、任何數值型別中的0、空字串"",空元組(),空列表[],空字典{}都被當做False,還有自定義型別,如果實現了nonzero()或len()方法返回0或False,則也被當做False,其他物件均為True。

>>> True
True 
>>> False 
False 
>>>
3 > 2 True >>> 3 > 5 False

2. 字串 —>str類

Python字串即可以用單引號也可以用雙引號括起來,甚至還可以用三引號括起來 。字串是以單引號、雙引號或三引號括起來的任意文字,比如’abc’, “12c”,’’‘好的’’'等等。需要注意的是,引號本身是一種表達方式,不是字串的一部分。

3. 列表—>list類

列表用符號[]表示,中間的元素可以是任何型別,多個元素之間用逗號分隔。

>>> a = [1,'ab',3,'cd',5]

>>>print(a)
[1, 'ab', 3, 'cd', 5]
>>>print(type(a))
<class 'list'>

切片 切片是指抽取序列的一部分,其形式為:list[start : end : step],預設的步長為1,但也可自定義。另外,切片時,含首不含尾。

>>> a = [1,'ab',3,'cd',5]
>>>a[1:3]
['ab', 3]
>>>a[::2]
[1, 3, 5]

4. 元組—>tuple類

元組用符號 () 表示,中間的元素可以是任何型別,多個元素之間用逗號分隔。元組和列表有相似的資料結構,但是陣列是可變的,而元組一旦初始化後就不能更改,速度比列表快。

>>>a = (1,'ab',3,'cd',5)
>>>type(a)
tuple
>>>a[::2]
(1, 3, 5)

5. 字典—>dict類

字典是一種無序儲存結構,字典用符號 {}表示。包括關鍵字(Key)和關鍵字對應的值(value)。字典的格式為dictionary = {key:value}。關鍵字為不可變型別,如字串、整數、只包含不可變物件的元組,列表等不可作為關鍵字。如果列表中存在關鍵字對,可以用dict()直接構造字典。

>>>a = [['a',1],['b',2],['c',3],['d',4]]
[['a', 1], ['b', 2], ['c', 3], ['d', 4]]

>>>dict(a)
{'a': 1, 'b': 2, 'c': 3, 'd': 4}

6. 集合—>set類

集合是無序的,不重複的元素集,類似數學中的集合。可進行邏輯運算和算術運算。 list = [1,3,2,4,5,1] set1 = set(list) set1

>>>list = [1,3,2,4,5,1]
>>>set1 = set(list)
>>>set1
{1, 2, 3, 4, 5}