1. 程式人生 > >Python 資料型別之 集合 set

Python 資料型別之 集合 set

####集合

集合是無序的,不重複的資料集合,它裡面的元素是可雜湊的(不可變型別),但是集合本身是不可雜湊(所以集合做不了字典的鍵)的。以下是集合最重要的兩點:

1.去重,把一個列表變成集合,就自動去重了。

2.關係測試,測試兩組資料之前的交集、差集、並集等關係。

#建立集合

##建立集合
set1 = set({1,2,3})
print(set1)
set2 = {1,2,3,[1,2],{"name":"span"}}#集合裡的元素必須是不可變資料型別
print(set2)

>>>{1, 2, 3}
>>>TypeError: unhashable type: '
list'

##在集合中增加元素:#在集合中增加元素set.add() ;set.update()

#在集合中增加元素set.add()  set.update()
set3 = {"span","金融","Fore"}
set3.add("量化交易")
print(set3)
set3.update("量化交易") #迭代地新增
print(set3)
>>>{'span', '金融', '量化交易', 'Fore'}
>>>{'', '', '量化交易', 'Fore', '', 'span', '金融', ''}

###刪除集合的元素

#set.pop()隨機刪除

#刪除,set.pop()  隨機地刪除
set4 = {"span","金融","Fore"}
set4.pop()
print(set4)
>>>{"span","Fore"}

#set.remove() 按元素刪除

# set.remove() 按元素刪除
set4 = {"span","金融","Fore"}
set4.remove("span") #按元素刪除,沒有會報錯
print(set4)
>>>{'Fore', '金融'}

#set.clear() 清空集合 返回set()

set5 = {"
span","金融","Fore"} set5.clear() print(set5) >>>set() ##因為空字典的返回型別是{},因此空集合的返回型別是set()

##刪除整個集合 del set

# del 刪除
set6 = {"span","金融","Fore"}
del set6
print(set6)

>>>NameError: name 'set6' is not defined
#查詢集合中的元素 由於集合資料型別沒有順序不能採用索引及切片,並且也沒有鍵值對
#因此只能採用for 迴圈來進行查詢
#查詢集合中的元素 由於集合資料型別沒有順序不能採用索引及切片,並且也沒有鍵值對
#因此只能採用for 迴圈來進行查詢
set7 = {"span","金融","Fore"}
for i in set7:
    print(i)
>>>
金融
span
Fore

######################################################################################################################################

集合的特別之處在於可以求集合的交集、並集、補集(反交集)

#交集 & 或者 intersection()

#集合的交集
set1 = {1,2,3,4,5,6,7,8}
set2 = {4,5,6,9,10}
print(set1 & set2)
print(set1.intersection(set2))
>>>{4, 5, 6}
>>>{4, 5, 6}

#並集 |   或者 union()

# 並集
set1 = {1,2,3,4,5,6,7,8}
set2 = {4,5,6,9,10}
print(set1 | set2)
print(set1.union(set2))

>>>{1, 2, 3, 4, 5, 6, 7, 8, 9, 10}
>>>{1, 2, 3, 4, 5, 6, 7, 8, 9, 10}

##補集(反交集) ^ 或者 symmetric_difference()

##補集
set1 = {1,2,3,4,5,6,7,8}
set2 = {4,5,6,9,10}
print(set1 ^ set2)
print(set1.symmetric_difference(set2))
>>>{1, 2, 3, 7, 8, 9, 10}
>>>{1, 2, 3, 7, 8, 9, 10}

#差集- 或者 difference

#差集
set1 = {1,2,3,4,5,6,7,8}
set2 = {4,5,6,9,10}
print(set1 - set2) # set1中獨有的而set2中沒有的
print(set1.difference(set2))

>>>{1, 2, 3, 7, 8}
>>>{1, 2, 3, 7, 8}

##包含關係 子集合 

set1 = {1,2,3,4,5,6,7,8}
set2 = {4,5,6,}
print(set1 > set2) # set1包含set2,set2 是set1的子集; set1是 set2的超集
print(set2.issubset(set1))
>>>True
>>>True

###超集

set1 = {1,2,3,4,5,6,7,8}
set2 = {4,5,6,}
print(set2 < set1) # set1包含set2,set1 是set2的超集
print(set1.issuperset(set2))
>>>True
>>>True

######

##補充:集合資料型別可以去重

# 去重
li = [1,2,3,4,33,3,88,2]
set1= set(li)
print(set1)
li = list(set1)
print(li)
>>>{1, 2, 3, 4, 33, 88}
>>>[1, 2, 3, 4, 33, 88]
#集合資料型別是可變資料型別,frozenset()是不可變資料型別
s = frozenset("span")
print(s,type(s))
>>>frozenset({'a', 's', 'n', 'p'}) <class 'frozenset'>