1. 程式人生 > >Python筆記(五)——Dict(字典)和set(集合)

Python筆記(五)——Dict(字典)和set(集合)

一、Dict(字典)

1.1 字典的定義

字典是另一種可變容器模型,且可儲存任意型別物件

字典的每個鍵值(key=>value)冒號(:)分割每個對之間用逗號(,)分割,整個字典包括在花括號({})中 ,格式如下所示:

d = {key1 : value1, key2 : value2 }

必須是唯一的,但值則不必

值可以取任何資料型別,但鍵必須是不可變的如字串,數字或元組。

一個簡單的字典例項:

dict = {'Alice': '2341', 'Beth': '9102', 'Cecil': '3258'}

也可如此建立字典:

dict1 = { 'abc': 456 }; 
dict2 = { 'abc': 123, 98.6: 37 };
  • 字典的作用:給定一個名字,就可以直接查到分數。

由於dict也是集合,len() 函式可以計算任意集合的大小:

>>> len(d)
3

注意: 一個 key-value 算一個,因此,dict大小為3。

任務

新來的Paul同學成績是 75 分,請編寫一個dict,把Paul同學的成績也加進去。

d = {
    'Adam': 95,
    'Lisa': 85,
    'Bart': 59
}
d = {
'Adam': 95,
'Lisa': 85,
'Bart': 59,
'Paul': 75
}
print(d)

1.2 Python之訪問dict

  • 把相應的鍵放入到括號中

我們已經能建立一個dict,用於表示名字和成績的對應關係:

d = { 
    'Adam': 95, 
    'Lisa': 85, 
    'Bart': 59 
    }

那麼,如何根據名字來查詢對應的成績呢?

可以簡單地使用 d[key] 的形式來查詢對應的 value,這和 list 很像,不同之處是,list 必須使用索引返回對應的元素,而dict使用key:

>>> print d['Adam'] 
95 
>>> print d['Paul'] 
Traceback (most recent call last): 
  File "index.py", line 11, in <module> 
    print d['Paul'] 
KeyError: 'Paul'

注意: 通過 key 訪問 dict 的value,只要 key 存在,dict就返回對應的value。如果key不存在,會直接報錯:KeyError。

要避免 KeyError 發生,有兩個辦法:

一是先判斷一下 key 是否存在,用 in 操作符:

if 'Paul' in d:
    print d['Paul']

如果 'Paul' 不存在,if語句判斷為False,自然不會執行 print d['Paul'] ,從而避免了錯誤。

二是使用dict本身提供的一個 get 方法,在Key不存在的時候,返回None:

>>> print d.get('Bart') 
59 
>>> print d.get('Paul') 
None

1.3 Python之遍歷dict

由於dict也是一個集合,所以,遍歷dict和遍歷list類似,都可以通過 for 迴圈實現。

直接使用for迴圈可以遍歷 dict 的 key:

>>> d = { 'Adam': 95, 'Lisa': 85, 'Bart': 59 } 
>>> for key in d: 
...     print(key + ':', d[key]) 
... 
Lisa : 95
Adam : 85
Bart : 59

由於通過 key 可以獲取對應的 value,因此,在迴圈體內,可以獲取到value的值。

1.4 Python新增字典元素

dict是可變的,也就是說,我們可以隨時往dict中新增新的 key-value。比如已有dict:

d = {
    'Adam': 95,
    'Lisa': 85,
    'Bart': 59
}

要把新同學'Paul'的成績 72 加進去,用賦值語句

>>> d['Paul'] = 72

再看看dict的內容:

>>> print d
{'Lisa': 85, 'Paul': 72, 'Adam': 95, 'Bart': 59}

如果 key 已經存在,則賦值會用新的 value 替換掉原來的 value:

>>> d['Bart'] = 60
>>> print d
{'Lisa': 85, 'Paul': 72, 'Adam': 95, 'Bart': 60}

1.5 刪除字典元素

能刪單一的元素也能清空字典,清空只需一項操作。

顯示刪除一個字典用del命令,如下例項:

dict = {'Name': 'Runoob', 'Age': 7, 'Class': 'First'} 

del dict['Name'] # 刪除鍵 'Name' 
dict.clear() # 清空字典 
del dict # 刪除字典 

print ("dict['Age']: ", dict['Age']) 
print ("dict['School']: ", dict['School'])

但這會引發一個異常,因為用執行 del 操作後字典不再存在:

Traceback (most recent call last):
  File "test.py", line 9, in <module>
    print ("dict['Age']: ", dict['Age'])
TypeError: 'type' object is not subscr

注:del() 方法後面也會討論。

1.6 Python中dict的特點

字典值可以是任何的 python 物件,既可以是標準的物件,也可以是使用者定義的,但鍵不行。

以下重要的點需要記住:

  • 1)dict查詢速度快,無論dict有10個元素還是10萬個元素,查詢速度都一樣。而list的查詢速度隨著元素增加而逐漸下降。

不過dict的查詢速度快不是沒有代價的,dict的缺點是佔用記憶體大,還會浪費很多內容,list正好相反,佔用記憶體小,但是查詢速度慢。

 

  • 2)由於dict是按 key 查詢,所以,在一個dict中,不允許同一個鍵出現兩次。建立時如果同一個鍵被賦值兩次,後一個值會被記住,如下例項:
dict = {'Name': 'Runoob', 'Age': 7, 'Name': '小菜鳥'}
print ("dict['Name']: ", dict['Name'])

以上例項輸出結果:

dict['Name']: 小菜鳥
  • 3)必須不可變,Python的基本型別如字串、整數、浮點數或元組都是不可變的,所以可以作為key(鍵),而列表就不行,如下例項:
dict = {['Name']: 'Runoob', 'Age': 7}
print ("dict['Name']: ", dict['Name'])

以上例項輸出結果:

Traceback (most recent call last):
  File "test.py", line 3, in <module>
    dict = {['Name']: 'Runoob', 'Age': 7}
TypeError: unhashable type: 'list'

不可變這個限制僅作用於key,value是否可變無所謂:

{
    '123': [1, 2, 3],  # key 是 str,value是list
    123: '123',  # key 是 int,value 是 str
    ('a', 'b'): True  # key 是 tuple,並且tuple的每個元素都是不可變物件,value是 boolean
}

最常用的key還是字串,因為用起來最方便

  • 4)dict儲存的key-value序對是沒有順序的!這和list不一樣:
d = {
    'Adam': 95,
    'Lisa': 85,
    'Bart': 59
}

當我們試圖列印這個dict時:

>>> print d
{'Lisa': 85, 'Adam': 95, 'Bart': 59}

列印的順序不一定是我們建立時的順序,而且,不同的機器列印的順序都可能不同,這說明dict內部是無序的,不能用dict儲存有序的集合


二、set(集合)

dict的作用是建立一組 key 和一組 value 的對映關係,dict的key是不能重複的。

有的時候,我們只想要 dict 的 key,不關心 key 對應的 value,目的就是保證這個集合的元素不會重複,這時,set就派上用場了。

set 持有一系列元素,這一點和 list 很像,集合(set)是一個無序的不重複元素序列。這點和 dict 的 key很像。

集合(set)是一個無序不重複元素序列

2.1 set的建立

可以使用大括號 { } 或者 set() 函式建立集合,注意:建立一個空集合必須用 set() 而不是 { },因為 { } 是用來建立一個空字典。

建立格式:

parame = {value01,value02,...}
或者
set(value)

    呼叫 set() 並傳入一個 list,list的元素將作為set的元素:

>>> s = set(['A', 'B', 'C'])

可以檢視 set 的內容:

>>> print s
{'A', 'C', 'B'}

請注意,上述列印的形式類似 list, 但它不是 list,仔細看還可以發現,列印的順序和原始 list 的順序有可能是不同的,因為set內部儲存的元素是無序的。

因為set不能包含重複的元素,所以,當我們傳入包含重複元素的 list 會怎麼樣呢?

>>> s = set(['A', 'B', 'C', 'C'])
>>> print s
set(['A', 'C', 'B'])
>>> len(s)
3

結果顯示,set會自動去掉重複的元素,原來的list有4個元素,但set只有3個元素。

2.2 Python之訪問set

由於set儲存的是無序集合,所以我們沒法通過索引來訪問。

訪問 set中的某個元素實際上就是判斷一個元素是否在set中。

例如,儲存了班裡同學名字的set:

>>> s = set(['Adam', 'Lisa', 'Bart', 'Paul'])

我們可以用 in 操作符判斷:

Bart是該班的同學嗎?

>>> 'Bart' in s
True

Bill是該班的同學嗎?

>>> 'Bill' in s
False

bart是該班的同學嗎?

>>> 'bart' in s
False

看來大小寫很重要,'Bart' 和 'bart'被認為是兩個不同的元素。

任務

由於上述set不能識別小寫的名字,請改進set,使得 'adam' 和 'bart'都能返回True。

s = set(['Adam', 'adam', 'Lisa', 'lisa', 'Bart', 'bart', 'Paul', 'paul'])
print ('adam' in s)
print ('bart' in s)

2.3 Python之 set的特點

set的內部結構和dict很像,唯一區別是不儲存value,因此,判斷一個元素是否在set中速度很快。

set儲存的元素和dict的key類似,必須是不變物件,因此,任何可變物件是不能放入set中的。

最後,set儲存的元素也是沒有順序的。

set的這些特點,可以應用在哪些地方呢?

星期一到星期日可以用字串'MON', 'TUE', ... 'SUN'表示。

假設我們讓使用者輸入星期一至星期日的某天,如何判斷使用者的輸入是否是一個有效的星期呢?

可以用 if 語句判斷,但這樣做非常繁瑣:

x = '???' # 使用者輸入的字串 
if x!= 'MON' and x!= 'TUE' and x!= 'WED' ... and x!= 'SUN': 
    print 'input error' 
else: 
    print 'input ok'

注意:if 語句中的...表示沒有列出的其它星期名稱,測試時,請輸入完整。

如果事先建立好一個set,包含'MON' ~ 'SUN':

weekdays = set(['MON', 'TUE', 'WED', 'THU', 'FRI', 'SAT', 'SUN'])

再判斷輸入是否有效,只需要判斷該字串是否在set中:

x = '???' # 使用者輸入的字串 
if x in weekdays: 
    print 'input ok' 
else: 
    print 'input error'

這樣一來,程式碼就簡單多了。

任務

月份也可以用set表示,請設計一個set並判斷使用者輸入的月份是否有效。

月份可以用字串'Jan', 'Feb', ...表示。

months = set(['Jan', 'Feb', 'Mar', 'Apr', 'May', 'Jun', 'Jul', 'Aug', 'Sep', 'Oct', 'Nov', 'Dec'])
x1 = 'Feb'
x2 = 'Sun'

if x1 in months:
    print ('x1: ok')
else:
    print ('x1: error')

if x2 in months:
    print ('x2: ok')
else:
    print ('x2: error')

2.4 Python之 遍歷set

由於 set 也是一個集合,所以,遍歷 set 和遍歷 list 類似,都可以通過 for 迴圈實現。

直接使用 for 迴圈可以遍歷 set 的元素:

>>> s = set(['Adam', 'Lisa', 'Bart']) 
>>> for name in s: 
...     print name 
... 
Lisa 
Adam 
Bart

注意: 觀察 for 迴圈在遍歷set時,元素的順序和list的順序很可能是不同的,而且不同的機器上執行的結果也可能不同。

任務

請用 for 迴圈遍歷如下的set,打印出 name: score 來。

s = set([('Adam', 95), ('Lisa', 85), ('Bart', 59)])
s = set([('Adam', 95), ('Lisa', 85), ('Bart', 59)])
for x in s:
    print x[0] + ':', x[1] 

2.5 Python之 更新set

由於set儲存的是一組不重複的無序元素,因此,更新set主要做兩件事:

一是把新的元素新增到set中,二是把已有元素從set中刪除。

新增元素時,用set的add()方法:

>>> s = set([1, 2, 3])
>>> s.add(4)
>>> print s
set([1, 2, 3, 4])

如果新增的元素已經存在於set中,add()不會報錯,但是不會加進去了:

>>> s = set([1, 2, 3])
>>> s.add(3)
>>> print s
set([1, 2, 3])

刪除set中的元素時,用set的remove()方法:

>>> s = set([1, 2, 3, 4])
>>> s.remove(4)
>>> print s
set([1, 2, 3])

如果刪除的元素不存在set中,remove()會報錯:

>>> s = set([1, 2, 3])
>>> s.remove(4)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
KeyError: 4

注:用add()可以直接新增,而remove()前需要判斷。

任務

針對下面的set,給定一個list,對list中的每一個元素,如果在set中,就將其刪除,如果不在set中,就新增進去。

s = set(['Adam', 'Lisa', 'Paul'])
L = ['Adam', 'Lisa', 'Bart', 'Paul']

 

參考文獻

http://www.runoob.com/python3/python3-set.html