python学习之day03

哈喽~今天再来分享一波。今天主要讲解集合和字符编码。
一、集合
1、定义: 在{}内用逗号分隔开多个元素，多个元素满足以下三个条件 1.1. 集合内元素必须为不可变类型
1.2. 集合内元素无序
1.3. 集合内元素没有重复
2、s={} # 默认是空字典
3、定义空集合：s=set()
4、强制类型转换： res=set(‘hello’) #{‘h’,‘e’,‘l’,‘l’,‘o’}
5、内置方法
friends1 = {“zero”,“kevin”,“jason”,“egon”}
friends2 = {“Jy”,“ricky”,“jason”,“egon”}
5.1取交集：两者共同的好友
res=friends1 & friends2 print(res) print(friends1.intersection(friends2))
5.2 取并集/合集：两者所有的好友
print(friends1 | friends2)
print(friends1.union(friends2))
5.3 取差集：取friends1独有的好友
print(friends1 - friends2)
print(friends1.difference(friends2))
5.4对称差集: 求两个用户独有的好友们（即去掉共有的好友） print(friends1 ^ friends2) print(friends1.symmetric_difference(friends2))
二、字符编码
字符编码表就是一张字符与数字对应关系的表
python解释器默认读文件的编码
python3默认：utf-8
python2默认：ASCII
指定文件头修改默认的编码：
在py文件的首行写：
coding:gbk
ASCII表：1、只支持英文字符串 2、采用8位二进制数对应一个英文字符串
GBK表：1、支持英文字符、中文字符 2、采用8位（8bit=1Bytes）二进制数对应一个英文字符串
采用16位（16bit=2Bytes）二进制数对应一个中文字符串
unicode（内存中统一使用unicode）：1、兼容万国字符，与万国字符都有对应关系 2、采用16位（16bit=2Bytes）二进制数对应一个中文字符串，个别生僻会采用4Bytes、8Bytes
补充：文本文件存取乱码问题
存乱了：解决方法是，编码格式应该设置成支持文件内字符串的格式
取乱了：解决方法是，文件是以什么编码格式存如硬盘的，就应该以什么编码格式读入内存

杜sir_

发布了5 篇原创文章 · 获赞 2 · 访问量 64

私信关注

猜你喜欢