python学习之day03

哈喽~今天再来分享一波。 今天主要讲解集合和字符编码。
一、集合
1、定义: 在{}内用逗号分隔开多个元素,多个元素满足以下三个条件 1.1. 集合内元素必须为不可变类型
1.2. 集合内元素无序
1.3. 集合内元素没有重复
2、s={} # 默认是空字典
3、 定义空集合:s=set()
4、强制类型转换: res=set(‘hello’) #{‘h’,‘e’,‘l’,‘l’,‘o’}
5、内置方法
friends1 = {“zero”,“kevin”,“jason”,“egon”}
friends2 = {“Jy”,“ricky”,“jason”,“egon”}
5.1取交集:两者共同的好友
res=friends1 & friends2 print(res) print(friends1.intersection(friends2))
5.2 取并集/合集:两者所有的好友
print(friends1 | friends2)
print(friends1.union(friends2))
5.3 取差集:取friends1独有的好友
print(friends1 - friends2)
print(friends1.difference(friends2))
5.4对称差集: 求两个用户独有的好友们(即去掉共有的好友) print(friends1 ^ friends2) print(friends1.symmetric_difference(friends2))
二、字符编码
字符编码表就是一张字符与数字对应关系的表
python解释器默认读文件的编码
python3默认:utf-8
python2默认:ASCII
指定文件头修改默认的编码:
在py文件的首行写:
coding:gbk
ASCII表:1、只支持英文字符串 2、采用8位二进制数对应一个英文字符串
GBK表:1、支持英文字符、中文字符 2、采用8位(8bit=1Bytes)二进制数对应一个英文字符串
采用16位(16bit=2Bytes)二进制数对应一个中文字符串
unicode(内存中统一使用unicode):1、 兼容万国字符,与万国字符都有对应关系 2、采用16位(16bit=2Bytes)二进制数对应一个中文字符串,个别生僻会采用4Bytes、8Bytes
补充:文本文件存取乱码问题
存乱了:解决方法是,编码格式应该设置成支持文件内字符串的格式
取乱了:解决方法是,文件是以什么编码格式存如硬盘的,就应该以什么编码格式读入内存

发布了5 篇原创文章 · 获赞 2 · 访问量 64

猜你喜欢

转载自blog.csdn.net/weixin_43138641/article/details/104824895