python中的集合同数学中的集合概念类似,也是用于保存不重复元素的,所以集合最好的应用就是去重。
一、可变集合
1.集合的创建:
1.1直接创建(使用“{}”):如果在创建集合的过程中输入了重复的元素python会自动只保留一个。
>>> set1={1,2,3,4,5,4,3,2,0}
>>> set1
{0, 1, 2, 3, 4, 5}
1.2使用set()函数创建:在python中,可以使用set()函数将列表、元组等其他可迭代的对象转换为列表。
>>> list1=['Swan','duck','chicken','python']
>>> tuple1=(1,2,3,4,5,6)
>>> string='Python'
>>> set1=set(list1)
>>> set2=set(tuple1)
>>> set3=set(string)
>>> print(set1);print(set2);print(set3)
{'Swan', 'python', 'chicken', 'duck'}
{1, 2, 3, 4, 5, 6}
{'t', 'o', 'P', 'h', 'n', 'y'}
注意:创建空集合时只能用set()函数实现,而不能直接使用“{}”实现,因为在python中,直接使用“{}”表示创建一个空字典。
2.集合元素的添加和删除:
2.1向集合中添加元素:add()函数
>>> list1={1,2,3,2,5}
>>> list1.add('Swan')
>>> list1
{1, 2, 3, 5, 'Swan'}
2.2从集合中删除元素:
2.2.1删除整个集合:del()
>>> list1={1,2,3}
>>> del list1
>>> list1
Traceback (most recent call last):
File "<pyshell#26>", line 1, in <module>
list1
NameError: name 'list1' is not defined
2.2.2清空集合:clear()
>>> list2={2,1,2,3,4}
>>> list2.clear()
>>> list2
set()
2.2.3删除一个元素:pop(),pop()会返回删除的元素
>>> list3={'A','B','c'}
>>> list3.pop()
'A'
>>> list3
{'B', 'c'}
2.2.4删除指定的一个元素:remove()
>>> list4={'a','c','AQ','e'}
>>> if 'e'in list4: #防止要删除的元素不在集合中,程序会报错
list4.remove('e')
>>> list4
{'a', 'c', 'AQ'}
3.集合的交集、并集、差集:
3.1交集:“&”,并集:“|”,差集:“-”:
set1={'Swan','Tom','Ursula','Emma'}
set2={'Rebica','Ursula','Niklause','Swan'}
print("交集:",set1&set2)
print("并集:",set1|set2)
print("差集:",set1-set2)
#运行结果
交集: {'Swan', 'Ursula'}
并集: {'Swan', 'Ursula', 'Emma', 'Niklause', 'Tom', 'Rebica'}
差集: {'Emma', 'Tom'}
4.列表、元组、字典和集合的区别
数据结构 | 是否可变 | 是否重复 | 是否有序 | 定义符号 |
列表 | 可变 | 可重复 | 有序 | [ ] |
元组 | 不可变 | 可重复 | 有序 | ( ) |
字典 | 可变 | 可重复 | 无序 | {key:value} |
集合 | 可变 | 不可重复 | 无序 | { } |
二、不可变集合
1.使用frozenset定义一个不可变集合
>>> list1=[1,2,3,'Swan']
>>> set1=frozenset(list1)
>>> print(set1)
frozenset({1, 2, 3, 'Swan'})
>>> set1.add('Tom') #set1是不可变集合
Traceback (most recent call last):
File "<pyshell#4>", line 1, in <module>
set1.add('Tom')
AttributeError: 'frozenset' object has no attribute 'add'
拓展:
- 统计集合中元素的个数:len()
>>> set1={'q',1,2,3,4,3,2,1}
>>> len(set1)
5
- 用索引访问集合中某个位置的元素,程序会报错。因为集合中的元素是无序的!
- set1=set([1,2]);set2={[1,2]}:分别试试这两个语句,看看会出现什么样的结果。
>>> set1=set([1,2]) >>> set1 {1, 2} >>> set2={[1,2]} Traceback (most recent call last): File "<pyshell#15>", line 1, in <module> set2={[1,2]} TypeError: unhashable type: 'list'
报错信息提示说:列表是不可哈希的类型。原来集合的存储方式和字典的存储方式是一样的呀!仔细想一下,利用哈希函数计算,相同元素得到的哈希值(存放地址)是相同的,所以在集合中所有相同的元素都会被覆盖掉,因此集合中的元素具有唯一性!而且通过哈希函数计算的地址不可能是按顺序排放的,所以集合才强调是无序的!!
-
set1={1,1.0} 运行这个语句看看会得到什么结果。
>>> set1={1,1.0} >>> set1 {1}
出现上述结果是因为,python的哈希函数会将相同的值的元素计算得到相同的地址,1和1.0是等值的。