14、Python基本数据类型及内置方法(集合)

一、集合

1.1 集合及其作用

  什么是集合?集合就是在{}内用逗号分隔开多个元素,多个元素满足以下三个条件:

 1. 集合内元素必须为不可变类型
 2. 集合内元素无序
 3. 集合内元素没有重复
s={1,2}  # s=set({1,2})
s={1,[1,2]} # TypeError: unhashable type: 'list'
s={1,'a','v','b','g'}  # 元素无序,多次打印排序不一样
print(s)
s={1,2,3,3,3,3,3,'a','f'}  # {1, 2, 3, 'a', 'f'}
print(s)

  集合与list、tuple、dict一样,都可以存放多个值,但是集合主要用于:去重、关系运算。

l1=['abc','acd','111','222']
l2=['awc','aed','111','222']

l=[]
for x in l1:
    if x in l2:
        l.append(x)
print(l)  # ['111', '222']  列表的关系运算,取重合部分

  了解:

s={} # 默认是空字典
print(type(s))  # <class 'dict'>
定义空集合
s=set()
print(s,type(s))  # set() <class 'set'>

1.2 类型转换

  但凡能被for循环的遍历的数据类型(遍历出的每一个值都必须为不可变类型)都可以传给set()转换成集合类型

>>> s = set([1,2,3,4])  # 列表转换 
{1, 2, 3, 4}
>>> s1 = set((1,2,3,4))  # 元组转换
 {1, 2, 3, 4}
>>> s2 = set({'name':'jason',})
{'name'}
>>> s3 = set('goooooooal')
{'l', 'a', 'o', 'g'}
>>> s3 = set([1,1,1,1,1,1,1,2,[111,222]])  #报错,含有可变类型数据

1.3 集合的使用

  集合内置方法的使用:

>>>l1={'abc','acd','111','222'}
>>>l2={'qwc','qed','111','222'}

1.3.1 关系运算--取交集

>>>res=l1 & l2 # 优先使用符号进行运算
>>>print(res)
>>>print(l1.intersection(l2))  # 使用内置方法
{'111', '222'}

1.3.2 关系运算--取并集/合集:

>>>print(l1 | l2) # 优先使用符号进行运算
>>>print(l1.union(l2))
 {'abc', 'acd', '111', 'qed', 'qwc', '222'}

1.3.3 关系运算--取差集:

>>>print(l1 - l2)  # 优先使用符号进行运算
>>>print(l1.difference(l2))
 {'acd', 'abc'}
>>>print(l2 - l1)  # 优先使用符号进行运算
>>>print(l2.difference(l1))
{'qed', 'qwc'}

1.3.4 关系运算--对称差集:两个集合去掉重合部分

>>>print(l1 ^ l2)  # 优先使用符号进行运算
>>>print(l1.symmetric_difference(l2))
print((l1 - l2) |(l2 - l1))

1.3.5 关系运算--父子集 :包含的关系

>>>s1={1,2,3}
>>>s2={1,2,4}
>>>print(s1>s2)  # 不存在包含关系,False
>>>print(s1.issubset(s2))  # 不存在包含关系,False
>>>print(s1.issuperset(s2))  # 不存在包含关系,False

>>>s1={1,2,3}
>>>s2={1,2}
print(s1>s2)  # 当s1大于或等于s2时,才能说s1是s2的父集

>>>s1={1,2,3}
>>>s2={1,2,3}
print(s1==s2)  # s1与s2互为父子集

1.3.6 去重运算,有局限性

  局限性1:只能针对不可变类型去重,

>>>print(set([1,1,1,1,2]))
{1, 2}

  局限性2:无法保证原来的顺序

>>>l=[1,'a','b','z',1,1,1,2]
>>>l=list(set(l))
>>>print(l)
[1, 2, 'z', 'b', 'a']
若字典去重,可变类型去重使用字典,不能使用集合
>>>l=[{'name':'lili','age':18,'sex':'male'},
   {'name':'jack','age':73,'sex':'male'},
   {'name':'tom','age':20,'sex':'female'},
   {'name':'lili','age':18,'sex':'male'},
   {'name':'lili','age':18,'sex':'male'},
   ]
>>>new_l=[]
>>>for dic in l:
>>>     if dic not in new_l:
>>>         new_l.append(dic)
>>>print(new_l)
[{'name': 'lili', 'age': 18, 'sex': 'male'}, {'name': 'jack', 'age': 73, 'sex': 'male'}, {'name': 'tom', 'age': 20, 'sex': 'female'}]

1.3.7 其他内置方法

>>>s={1,2,3} #定义一个集合

方法1:discard

>>>s.discard(4) # 删除元素不存在do nothing
>>>print(s)
{1, 2, 3}
>>>s.remove(4) # 删除元素不存在则报错

方法2:update  更新集合元素

>>>s.update({1,3,5}) 
>>>print(s)
{1, 2, 3, 5}

方法3:pop  从集合中取走元素

>>>res=s.pop()
>>>print(res)
1

方法4:add  添加单个元素

>>>s.add(4)
>>>print(s)
{2, 3, 4, 5}

猜你喜欢

转载自www.cnblogs.com/zuiyouyingde/p/12482907.html