基本数据类型之集合

1、集合类型
    关系运算
    去重(有局限性)

2、总结与分类
    有序or无序:有序又称之为序列类型

    存一个值or多个值:存一个值称为原子类型,存多个值称为容器类型

    可变or不可变

3、字符编码(理论多,结论少)
    文本文件
    x='上'

基本数据类型之集合

1、作用

集合可以进行独特的关系运算,对某些数据能做出去重的操作

1.1 关系运算

friends1 = ["zero","kevin","jason","egon"]
friends2 = ["Jy","ricky","jason","egon"]
l=[]
for x in friends1:
    if x in friends2:
        l.append(x)
print(l)
# ['jason', 'egon']

如上面这段代码,要取两个列表中的共同朋友。需要进行较为复杂的操作,而使用集合,只需要一个方法便能得到。还有其他方法在后面会具体说明

friends1 = {"zero","kevin","jason","egon"}
friends2 = {"Jy","ricky","jason","egon"}

res=friends1 & friends2
print(res)
# {'jason', 'egon'}

print(friends1.intersection(friends2))
# {'jason', 'egon'}

1.2、去重

使用集合去重有两个注意点:

1.2.1 只能针对不可变类型去重

因为集合内不能存放不可哈希的数据类型,即集合内不能有可变数据类型的数据,所以集合的去重只能针对不可变类型去重。

print(set([1,1,1,1,2]))
# {1, 2}

print({1, 1, 1, [1, 1, 2]})
# TypeError: unhashable type: 'list'

1.2.2 无法保证原来的顺序

集合是一种无序的数据类型,所以去重后无法保证顺序相同

l=[1,'a','b','z',1,1,1,2]
l=list(set(l))
print(l)
# [1, 2, 'b', 'z', 'a']

下面是不使用集合的去重方法

l=[
    {'name':'lili','age':18,'sex':'male'},
    {'name':'jack','age':73,'sex':'male'},
    {'name':'tom','age':20,'sex':'female'},
    {'name':'lili','age':18,'sex':'male'},
    {'name':'lili','age':18,'sex':'male'},
]
new_l=[]
for dic in l:
    if dic not in new_l:
        new_l.append(dic)
print(new_l)

'''
[{'name': 'lili', 'age': 18, 'sex': 'male'}, {'name': 'jack', 'age': 73, 'sex': 'male'}, {'name': 'tom', 'age': 20, 'sex': 'female'}]
'''

2、定义:

集合的形式是在{}内用逗号分隔开多个元素,并且多个元素满足以下三个条件

2.1集合内元素必须为不可变类型

2.2集合内元素无序

2.3集合内元素没有重复

s={} # 直接使用{}默认创建空字典
print(type(s))
# <class 'dict'>

# 定义空集合的方法
s=set()
print(s,type(s))
# set() <class 'set'>

s={1,2} # s=set({1,2}),集合的定义
s={1} # s=set({1}),集合的定义


# 集合内元素的3个特征

s={1,[1,2]} # 集合内元素必须为不可变类型
# TypeError: unhashable type: 'list'

s={1,'a','z','b',4,7} # 集合内元素无序
# 输出结果不同

s={1,1,1,1,1,1,'a','b'} # 集合内元素没有重复
print(s)
# {1, 'a', 'b'}

3、类型转换

3.1类型转换的条件

所有能被for循环遍历的数据类型都能被转换成集合,但是有一个前提条件:这个数据内的元素必须都为不可变数据类型

res=set('hellolllll')
print(res)
# {'e', 'l', 'o', 'h'}

s = set(range(5))
print(s)
# {0, 1, 2, 3, 4}

print(set([1,1,1,1,1,1]))
# {1}

print(set([1,1,1,1,1,1,[11,222]]) # 报错
# TypeError: unhashable type: 'list'
      
print(set({'k1':1,'k2':2}))
# {'k2', 'k1'}

4、内置方法

4.1 关系运算符

4.1.1 取交集:两者共同的好友
friends1 = {"zero","kevin","jason","egon"}
friends2 = {"Jy","ricky","jason","egon"}
res=friends1 & friends2
print(res)
# {'egon', 'jason'}

print(friends1.intersection(friends2))
# {'egon', 'jason'}
4.1.2 取并集/合集:两者所有的好友
friends1 = {"zero","kevin","jason","egon"}
friends2 = {"Jy","ricky","jason","egon"}
print(friends1 | friends2)
# {'Jy', 'ricky', 'jason', 'kevin', 'egon', 'zero'}

print(friends1.union(friends2))
# {'Jy', 'ricky', 'jason', 'kevin', 'egon', 'zero'}
4.1.3 取差集:取friends1独有的好友
friends1 = {"zero","kevin","jason","egon"}
friends2 = {"Jy","ricky","jason","egon"}
print(friends1 - friends2)
# {'zero', 'kevin'}

print(friends1.difference(friends2))
# {'zero', 'kevin'}
取friends2独有的好友
friends1 = {"zero","kevin","jason","egon"}
friends2 = {"Jy","ricky","jason","egon"}
print(friends2 - friends1)
# {'Jy', 'ricky'}

print(friends2.difference(friends1))
# {'Jy', 'ricky'}
4.1.4 对称差集: 求两个用户独有的好友们(即去掉共有的好友)
friends1 = {"zero","kevin","jason","egon"}
friends2 = {"Jy","ricky","jason","egon"}
print(friends1 ^ friends2)
# {'ricky', 'Jy', 'zero', 'kevin'}

print(friends1.symmetric_difference(friends2))
# {'ricky', 'Jy', 'zero', 'kevin'}
4.1.5 父子集:包含的关系
s1={1,2,3}
s2={1,2,4}
# 不存在包含关系,下面比较均为False
print(s1 > s2)
print(s1 < s2)

s1={1,2,3}
s2={1,2}
print(s1 > s2) # 当s1大于或等于s2时,才能说是S2是s1的子集
print(s1.issuperset(s2)) # s1是父集
# True

print(s2.issubset(s1)) # s2是子集,s2 < s1  =>True
# True

s1={1,2,3}
s2={1,2,3}
print(s1 == s2) # s1与s2互为子集
# True

print(s1.issuperset(s2))
# True

print(s2.issuperset(s1))
# True

4.2其他操作

4.2.1 长度:

s1 = {1, 2, 3}
print(len(s1))
# 3

4.2.2 成员运算

s1 = {1, 2, 3}
print(1 in s1)
# True

4.2.3 循环遍历

s1 = {1, 2, 3}
for i in s1:
    print(i)

4.2.4 删除元素

4.2.4.1 discard
s1 = {1, 2, 3}
s1.discard(4)
# 不会报错
4.2.4.2 remove
s1 = {1, 2, 3}
s1.remove(4)
# KeyError: 4
4.2.4.3 pop

pop有返回值:删除的元素

s1 = {1, 2, 3}
res = s1.pop()
print(res)
# 1

print(s1)
# {2, 3}

4.2.5 添加元素:add

s1 = {1, 2, 3}
s1.add(4)
print(s1)
# {1, 2, 3, 4}

4.2.6 更新:update

s1 = {1, 2, 3}
s1.update({1, 3, 5})
print(s1)
# {1, 2, 3, 5}

4.2.6 仅作了解的方法

4.2.6.1 是否独立:isdisjoint
s1 = {1, 2, 3}
res = s1.isdisjoint({3, 4, 5, 6})
# 两个集合有交集,则返回False
print(res)
res = s1.isdisjoint({4, 5, 6})
# 两个集合完全独立、没有共同部分,则返回True
print(res)
4.2.6.2 update系列

这个系列相当于在之前的功能上添加一个赋值操作

s = {1, 2, 3}
s.difference_update({3,4,5}) # s=s.difference({3,4,5})
print(s)
# {1, 2}

猜你喜欢

转载自www.cnblogs.com/achai222/p/12482927.html