版权声明:本文为博主原创文章,转载请注明出处~谢谢! https://blog.csdn.net/SMith7412/article/details/88117706
1.collections模块介绍:
collections是Python内建的一个集合模块,提供了许多有用的集合类。该模块实现了专门的容器数据类型,提供了Python的通用内置容器,dict,list,set和tuple的替代方法。
2.counter类
官网参考:https://docs.python.org/3.6/library/collections.html#collections.Counter
Counter类的目的是用来跟踪值出现的次数。它是一个无序的容器类型,以字典的键值对形式存储,其中元素作为key,其计数作为value。计数值可以是任意的Interger(包括0和负数)。Counter类和其他语言的bags或multisets很相似。
Counter类创建方式有以下几种:
元素从可迭代计数或从另一个映射(或计数器)初始化:
>>> c = Counter() # 创建一个Counter类
>>> c = Counter('gallahad') # 创建一个可迭代对象
>>> c = Counter({'red': 4, 'blue': 2}) # 创建一个字典对象
>>> c = Counter(cats=4, dogs=8) # 从键值对创建
对于counter类里边没有的元素,将返回 0
>>> c = Counter(['eggs', 'ham'])
>>> c['bacon']
0
>>> c['eggs']
1
del 删除键
当计数值为0时,并不意味着元素被删除,删除元素应当使用
>>> c['sausage'] = 0
>>> del c['sausage']
>> c
0
elements()
在元素上返回一个迭代器,重复每个元素的次数。 元素以任意顺序返回。 如果元素的计数小于1,则elements()将忽略它。
>>> c = Counter(a=4, b=2, c=0, d=-2)
>>> sorted(c.elements())
['a', 'a', 'a', 'a', 'b', 'b']
most_common([n])
返回n个最常见元素及其计数的列表,计数从最大到最少。 如果省略n或None,则most_common()返回计数器中的所有元素。 具有相同计数的元素是任意排序的:
>>> Counter('abracadabra')
Counter({'a': 5, 'b': 2, 'r': 2, 'c': 1, 'd': 1})
>>> Counter('abracadabra').most_common(3)
[('a', 5), ('b', 2), ('r', 2)]
subtract() 与 update()
从迭代或从另一个映射(或Counter)中减去元素。 与dict.update()类似,但减去计数而不是替换它们。 输入和输出都可以是零或负数。
>>> c = Counter(a=4, b=2, c=0, d=-2)
>>> d = Counter(a=1, b=2, c=3, d=4)
>>> c.subtract(d)
>>> c
Counter({'a': 3, 'b': 0, 'c': -3, 'd': -6})
>>> c = Counter(a=4, b=2, c=0, d=-2)
>>> d = Counter(a=1, b=2, c=3, d=4)
>>> c.update(d)
>>> c
Counter({'a': 5, 'b': 4, 'c': 3, 'd': 2})
Counter对象的常见模式:
sum(c.values()) # 计算所有values 的总数
c.clear() # 重置 counts
list(c) # 将c 中的键转换为列表
set(c) # 将c 中的键转换为集合
dict(c) # 将c 中的键值转换为字典,c为counter
c.items() # 将c 中的键值转换为(elem, cnt),与字典中使用items() 相同
Counter(dict(list_of_pairs)) # 将 (elem, cnt) 转换为Counter对象
c.most_common()[:-n-1:-1] # 倒着打印(n-1)元素,即打印(n-1)最不常见的元素
+c # 去除0或values为负的counter
-c # 去除0和values为正的counter,并将负的values转换为正的values
counter 对象的数学运算
提供了几个数学运算来组合 Counter 对象以生成多个集合(计数大于零的Counter )。 加法和减法通过添加或减去相应元素的计数来组合计数器。 交集和并集返回相应计数的最小值和最大值。 每个操作都可以接受带有符号计数的输入,但输出将删除 Counter 小于1的结果。
扫描二维码关注公众号,回复:
5478539 查看本文章
>>> c = Counter(a=3, b=1)
>>> d = Counter(a=1, b=2)
>>> c + d # 两个counter 对应相加
Counter({'a': 4, 'b': 3})
>>> c - d # 减法只保留正数
Counter({'a': 2})
>>> c & d # 交集,返回计数的最小的值 min(c[x], d[x])
Counter({'a': 1, 'b': 1})
>>> c | d # 并集,返回计数的最大的值 max(c[x], d[x])
Counter({'a': 3, 'b': 2})