Python筆記(五)——Dict(字典)和set(集合)
一、Dict(字典)
1.1 字典的定義
字典是另一種可變容器模型,且可儲存任意型別物件。
字典的每個鍵值(key=>value)對用冒號(:)分割,每個對之間用逗號(,)分割,整個字典包括在花括號({})中 ,格式如下所示:
d = {key1 : value1, key2 : value2 }
鍵必須是唯一的,但值則不必。
值可以取任何資料型別,但鍵必須是不可變的,如字串,數字或元組。
一個簡單的字典例項:
dict = {'Alice': '2341', 'Beth': '9102', 'Cecil': '3258'}
也可如此建立字典:
dict1 = { 'abc': 456 }; dict2 = { 'abc': 123, 98.6: 37 };
- 字典的作用:給定一個名字,就可以直接查到分數。
由於dict也是集合,len() 函式可以計算任意集合的大小:
>>> len(d)
3
注意: 一個 key-value 算一個,因此,dict大小為3。
任務
新來的Paul同學成績是 75 分,請編寫一個dict,把Paul同學的成績也加進去。
d = { 'Adam': 95, 'Lisa': 85, 'Bart': 59 }
d = { 'Adam': 95, 'Lisa': 85, 'Bart': 59, 'Paul': 75 } print(d)
1.2 Python之訪問dict
- 把相應的鍵放入到括號中
我們已經能建立一個dict,用於表示名字和成績的對應關係:
d = {
'Adam': 95,
'Lisa': 85,
'Bart': 59
}
那麼,如何根據名字來查詢對應的成績呢?
可以簡單地使用 d[key] 的形式來查詢對應的 value,這和 list 很像,不同之處是,list 必須使用索引返回對應的元素,而dict使用key:
>>> print d['Adam'] 95 >>> print d['Paul'] Traceback (most recent call last): File "index.py", line 11, in <module> print d['Paul'] KeyError: 'Paul'
注意: 通過 key 訪問 dict 的value,只要 key 存在,dict就返回對應的value。如果key不存在,會直接報錯:KeyError。
要避免 KeyError 發生,有兩個辦法:
一是先判斷一下 key 是否存在,用 in 操作符:
if 'Paul' in d:
print d['Paul']
如果 'Paul' 不存在,if語句判斷為False,自然不會執行 print d['Paul'] ,從而避免了錯誤。
二是使用dict本身提供的一個 get 方法,在Key不存在的時候,返回None:
>>> print d.get('Bart')
59
>>> print d.get('Paul')
None
1.3 Python之遍歷dict
由於dict也是一個集合,所以,遍歷dict和遍歷list類似,都可以通過 for 迴圈實現。
直接使用for迴圈可以遍歷 dict 的 key:
>>> d = { 'Adam': 95, 'Lisa': 85, 'Bart': 59 }
>>> for key in d:
... print(key + ':', d[key])
...
Lisa : 95
Adam : 85
Bart : 59
由於通過 key 可以獲取對應的 value,因此,在迴圈體內,可以獲取到value的值。
1.4 Python新增字典元素
dict是可變的,也就是說,我們可以隨時往dict中新增新的 key-value。比如已有dict:
d = {
'Adam': 95,
'Lisa': 85,
'Bart': 59
}
要把新同學'Paul'的成績 72 加進去,用賦值語句:
>>> d['Paul'] = 72
再看看dict的內容:
>>> print d
{'Lisa': 85, 'Paul': 72, 'Adam': 95, 'Bart': 59}
如果 key 已經存在,則賦值會用新的 value 替換掉原來的 value:
>>> d['Bart'] = 60
>>> print d
{'Lisa': 85, 'Paul': 72, 'Adam': 95, 'Bart': 60}
1.5 刪除字典元素
能刪單一的元素也能清空字典,清空只需一項操作。
顯示刪除一個字典用del命令,如下例項:
dict = {'Name': 'Runoob', 'Age': 7, 'Class': 'First'}
del dict['Name'] # 刪除鍵 'Name'
dict.clear() # 清空字典
del dict # 刪除字典
print ("dict['Age']: ", dict['Age'])
print ("dict['School']: ", dict['School'])
但這會引發一個異常,因為用執行 del 操作後字典不再存在:
Traceback (most recent call last): File "test.py", line 9, in <module> print ("dict['Age']: ", dict['Age']) TypeError: 'type' object is not subscr
注:del() 方法後面也會討論。
1.6 Python中dict的特點
字典值可以是任何的 python 物件,既可以是標準的物件,也可以是使用者定義的,但鍵不行。
以下重要的點需要記住:
- 1)dict查詢速度快,無論dict有10個元素還是10萬個元素,查詢速度都一樣。而list的查詢速度隨著元素增加而逐漸下降。
不過dict的查詢速度快不是沒有代價的,dict的缺點是佔用記憶體大,還會浪費很多內容,list正好相反,佔用記憶體小,但是查詢速度慢。
- 2)由於dict是按 key 查詢,所以,在一個dict中,不允許同一個鍵出現兩次。建立時如果同一個鍵被賦值兩次,後一個值會被記住,如下例項:
dict = {'Name': 'Runoob', 'Age': 7, 'Name': '小菜鳥'}
print ("dict['Name']: ", dict['Name'])
以上例項輸出結果:
dict['Name']: 小菜鳥
- 3)鍵必須不可變,Python的基本型別如字串、整數、浮點數或元組都是不可變的,所以可以作為key(鍵),而列表就不行,如下例項:
dict = {['Name']: 'Runoob', 'Age': 7}
print ("dict['Name']: ", dict['Name'])
以上例項輸出結果:
Traceback (most recent call last): File "test.py", line 3, in <module> dict = {['Name']: 'Runoob', 'Age': 7} TypeError: unhashable type: 'list'
不可變這個限制僅作用於key,value是否可變無所謂:
{
'123': [1, 2, 3], # key 是 str,value是list
123: '123', # key 是 int,value 是 str
('a', 'b'): True # key 是 tuple,並且tuple的每個元素都是不可變物件,value是 boolean
}
最常用的key還是字串,因為用起來最方便。
- 4)dict儲存的key-value序對是沒有順序的!這和list不一樣:
d = {
'Adam': 95,
'Lisa': 85,
'Bart': 59
}
當我們試圖列印這個dict時:
>>> print d
{'Lisa': 85, 'Adam': 95, 'Bart': 59}
列印的順序不一定是我們建立時的順序,而且,不同的機器列印的順序都可能不同,這說明dict內部是無序的,不能用dict儲存有序的集合。
二、set(集合)
dict的作用是建立一組 key 和一組 value 的對映關係,dict的key是不能重複的。
有的時候,我們只想要 dict 的 key,不關心 key 對應的 value,目的就是保證這個集合的元素不會重複,這時,set就派上用場了。
set 持有一系列元素,這一點和 list 很像,集合(set)是一個無序的不重複元素序列。這點和 dict 的 key很像。
集合(set)是一個無序的不重複元素序列。
2.1 set的建立
可以使用大括號 { } 或者 set() 函式建立集合,注意:建立一個空集合必須用 set() 而不是 { },因為 { } 是用來建立一個空字典。
建立格式:
parame = {value01,value02,...}
或者
set(value)
呼叫 set() 並傳入一個 list,list的元素將作為set的元素:
>>> s = set(['A', 'B', 'C'])
可以檢視 set 的內容:
>>> print s
{'A', 'C', 'B'}
請注意,上述列印的形式類似 list, 但它不是 list,仔細看還可以發現,列印的順序和原始 list 的順序有可能是不同的,因為set內部儲存的元素是無序的。
因為set不能包含重複的元素,所以,當我們傳入包含重複元素的 list 會怎麼樣呢?
>>> s = set(['A', 'B', 'C', 'C'])
>>> print s
set(['A', 'C', 'B'])
>>> len(s)
3
結果顯示,set會自動去掉重複的元素,原來的list有4個元素,但set只有3個元素。
2.2 Python之訪問set
由於set儲存的是無序集合,所以我們沒法通過索引來訪問。
訪問 set中的某個元素實際上就是判斷一個元素是否在set中。
例如,儲存了班裡同學名字的set:
>>> s = set(['Adam', 'Lisa', 'Bart', 'Paul'])
我們可以用 in 操作符判斷:
Bart是該班的同學嗎?
>>> 'Bart' in s
True
Bill是該班的同學嗎?
>>> 'Bill' in s
False
bart是該班的同學嗎?
>>> 'bart' in s
False
看來大小寫很重要,'Bart' 和 'bart'被認為是兩個不同的元素。
任務
由於上述set不能識別小寫的名字,請改進set,使得 'adam' 和 'bart'都能返回True。
s = set(['Adam', 'adam', 'Lisa', 'lisa', 'Bart', 'bart', 'Paul', 'paul'])
print ('adam' in s)
print ('bart' in s)
2.3 Python之 set的特點
set的內部結構和dict很像,唯一區別是不儲存value,因此,判斷一個元素是否在set中速度很快。
set儲存的元素和dict的key類似,必須是不變物件,因此,任何可變物件是不能放入set中的。
最後,set儲存的元素也是沒有順序的。
set的這些特點,可以應用在哪些地方呢?
星期一到星期日可以用字串'MON', 'TUE', ... 'SUN'表示。
假設我們讓使用者輸入星期一至星期日的某天,如何判斷使用者的輸入是否是一個有效的星期呢?
可以用 if 語句判斷,但這樣做非常繁瑣:
x = '???' # 使用者輸入的字串
if x!= 'MON' and x!= 'TUE' and x!= 'WED' ... and x!= 'SUN':
print 'input error'
else:
print 'input ok'
注意:if 語句中的...表示沒有列出的其它星期名稱,測試時,請輸入完整。
如果事先建立好一個set,包含'MON' ~ 'SUN':
weekdays = set(['MON', 'TUE', 'WED', 'THU', 'FRI', 'SAT', 'SUN'])
再判斷輸入是否有效,只需要判斷該字串是否在set中:
x = '???' # 使用者輸入的字串
if x in weekdays:
print 'input ok'
else:
print 'input error'
這樣一來,程式碼就簡單多了。
任務
月份也可以用set表示,請設計一個set並判斷使用者輸入的月份是否有效。
月份可以用字串'Jan', 'Feb', ...表示。
months = set(['Jan', 'Feb', 'Mar', 'Apr', 'May', 'Jun', 'Jul', 'Aug', 'Sep', 'Oct', 'Nov', 'Dec'])
x1 = 'Feb'
x2 = 'Sun'
if x1 in months:
print ('x1: ok')
else:
print ('x1: error')
if x2 in months:
print ('x2: ok')
else:
print ('x2: error')
2.4 Python之 遍歷set
由於 set 也是一個集合,所以,遍歷 set 和遍歷 list 類似,都可以通過 for 迴圈實現。
直接使用 for 迴圈可以遍歷 set 的元素:
>>> s = set(['Adam', 'Lisa', 'Bart'])
>>> for name in s:
... print name
...
Lisa
Adam
Bart
注意: 觀察 for 迴圈在遍歷set時,元素的順序和list的順序很可能是不同的,而且不同的機器上執行的結果也可能不同。
任務
請用 for 迴圈遍歷如下的set,打印出 name: score 來。
s = set([('Adam', 95), ('Lisa', 85), ('Bart', 59)])
s = set([('Adam', 95), ('Lisa', 85), ('Bart', 59)])
for x in s:
print x[0] + ':', x[1]
2.5 Python之 更新set
由於set儲存的是一組不重複的無序元素,因此,更新set主要做兩件事:
一是把新的元素新增到set中,二是把已有元素從set中刪除。
新增元素時,用set的add()方法:
>>> s = set([1, 2, 3])
>>> s.add(4)
>>> print s
set([1, 2, 3, 4])
如果新增的元素已經存在於set中,add()不會報錯,但是不會加進去了:
>>> s = set([1, 2, 3])
>>> s.add(3)
>>> print s
set([1, 2, 3])
刪除set中的元素時,用set的remove()方法:
>>> s = set([1, 2, 3, 4])
>>> s.remove(4)
>>> print s
set([1, 2, 3])
如果刪除的元素不存在set中,remove()會報錯:
>>> s = set([1, 2, 3])
>>> s.remove(4)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
KeyError: 4
注:用add()可以直接新增,而remove()前需要判斷。
任務
針對下面的set,給定一個list,對list中的每一個元素,如果在set中,就將其刪除,如果不在set中,就新增進去。
s = set(['Adam', 'Lisa', 'Paul'])
L = ['Adam', 'Lisa', 'Bart', 'Paul']
參考文獻
http://www.runoob.com/python3/python3-set.html