Python之基础数据类型

数据类型

计算机顾名思义就是可以做数学计算的机器，因此，计算机程序理所当然地可以处理各种数值。但是，计算机能处理的远不止数值，还可以处理文本、图形、音频、视频、网页等各种各样的数据，不同的数据，需要定义不同的数据类型。在Python中，能够直接处理的数据类型有以下几种

一 Number(数字)

1.1 数字类型的创建

注意这里与C的不同：

 
                 #include <stdio.h> 
                
                 void main(void) 
                
                 { 
                
                 int  
                 a  
                 =  
                 1 
                 ; 
                
                 int  
                 b  
                 =  
                 a; 
                
                 printf ( 
                 "a:adr:%p,val:%d,b:adr:%p,val:%d\n" 
                 ,&a,a,&b,b); 
                
                 a  
                 =  
                 3 
                 ; 
                
                 printf ( 
                 "a:adr:%p,val:%d,b:adr:%p,val:%d\n" 
                 ,&a,a,&b,b); 
                
                 } 
                
                 / 
                 / 
                 打印结果： 
                
                 topeet@ubuntu:~$ gcc test.c 
                
                 topeet@ubuntu:~$ . 
                 / 
                 a.out 
                
                 a:adr: 
                 0x7fff343a069c 
                 ,val: 
                 1 
                
                 b:adr: 
                 0x7fff343a0698 
                 ,val: 
                 1 
                
                 a:adr: 
                 0x7fff343a069c 
                 ,val: 
                 3 
                
                 b:adr: 
                 0x7fff343a0698 
                 ,val: 
                 1

1.2 Number 类型转换

 
                 var1 
                 = 
                 3.14 
                
                 var2 
                 = 
                 5 
                
                 var3 
                 = 
                 int 
                 (var1) 
                
                 var4 
                 = 
                 float 
                 (var2) 
                
                 print 
                 (var3,var4)

PY内置数学函数

二字符串类型（string）

字符串是以单引号'或双引号"括起来的任意文本，比如'abc'，"123"等等。

请注意，''或""本身只是一种表示方式，不是字符串的一部分，因此，字符串'abc'只有a，b，c这3个字符。如果'本身也是一个字符，那就可以用""括起来，比如"I'm OK"包含的字符是I，'，m，空格，O，K这6个字符。

2.1 创建字符串：

 
                 var1  
                 =  
                 'Hello World!' 
                
                 var2  
                 =  
                 "Python RAlvin"

对应操作：

 
                 # 1   * 重复输出字符串 
                
                 print 
                 ( 
                 'hello' 
                 * 
                 2 
                 ) 
                
                 # 2 [] ,[:] 通过索引获取字符串中字符,这里和列表的切片操作是相同的,具体内容见列表 
                
                 print 
                 ( 
                 'helloworld' 
                 [ 
                 2 
                 :]) 
                
                 # 3 in  成员运算符 - 如果字符串中包含给定的字符返回 True 
                
                 print 
                 ( 
                 'el'  
                 in  
                 'hello' 
                 ) 
                
                 # 4 %   格式字符串 
                
                 print 
                 ( 
                 'alex is a good teacher' 
                 ) 
                
                 print 
                 ( 
                 '%s is a good teacher' 
                 % 
                 'alex' 
                 ) 
                
                 # 5 +   字符串拼接 
                
                 a 
                 = 
                 '123' 
                
                 b 
                 = 
                 'abc' 
                
                 c 
                 = 
                 '789' 
                
                 d1 
                 = 
                 a 
                 + 
                 b 
                 + 
                 c 
                
                 print 
                 (d1) 
                
                 # +效率低,该用join 
                
                 d2 
                 = 
                 ''.join([a,b,c]) 
                
                 print 
                 (d2)

python的内置方法

View Code

三字节类型(bytes)

 
                 # a=bytes('hello','utf8') 
                
                 # a=bytes('中国','utf8') 
                
                 a 
                 = 
                 bytes( 
                 '中国' 
                 , 
                 'utf8' 
                 ) 
                
                 b 
                 = 
                 bytes( 
                 'hello' 
                 , 
                 'gbk' 
                 ) 
                
                 # 
                
                 print 
                 (a)         
                 #b'\xe4\xb8\xad\xe5\x9b\xbd' 
                
                 print 
                 ( 
                 ord 
                 ( 
                 'h' 
                 ))  
                 #其十进制 unicode 值为: 104 
                
                 print 
                 ( 
                 ord 
                 ( 
                 '中' 
                 )) 
                 #其十进制 unicode 值为:20013 
                
                 #  h   e  l   l   o 
                
                 # 104 101 108 108 111   编码后结果:与ASCII表对应 
                
                 #     中                国 
                
                 #   \xd6\xd0         \xb9\xfa       gbk编码后的字节结果 
                
                 #\xe4 \xb8 \xad   \xe5 \x9b \xbd    utf8编码后的字节结果 
                
                 # 228 184 173      229 155  189        a[:]切片取 
                
                 c 
                 = 
                 a.decode( 
                 'utf8' 
                 ) 
                
                 d 
                 = 
                 b.decode( 
                 'gbk' 
                 ) 
                
                 #b=a.decode('gbk') :很明显报错 
                
                 print 
                 (c)  
                 #中国 
                
                 print 
                 (d)  
                 #hello

注意：对于 ASCII 字符串，因为无论哪种编码对应的结果都是一样的，所以可以直接使用 b'xxxx' 赋值创建 bytes 实例，但对于非 ASCII 编码的字符则不能通过这种方式创建 bytes 实例，需要指明编码方式。

 
                 b1 
                 = 
                 b 
                 '123' 
                
                 print 
                 ( 
                 type 
                 (b1)) 
                
                 # b2=b'中国' #报错 
                
                 # 所以得这样: 
                
                 b2 
                 = 
                 bytes( 
                 '中国' 
                 , 
                 'utf8' 
                 ) 
                
                 print 
                 (b2) 
                 #b'\xe4\xb8\xad\xe5\x9b\xbd'

四布尔值

一个布尔值只有True、False两种值，要么是True，要么是False，在Python中，可以直接用True、False表示布尔值（请注意大小写）

与或非操作：

布尔值经常用在条件判断中:

 
                 age 
                 = 
                 18 
                
                 if  
                 age> 
                 18 
                 : 
                 #bool(age>18) 
                
                 print 
                 ( 
                 'old' 
                 ) 
                
                 else 
                 : 
                
                 print 
                 ( 
                 'young' 
                 )

五 List（列表）

OK,现在我们知道了字符串和整型两个数据类型了，那需求来了，我想把某个班所有的名字存起来，怎么办？

有同学说，不是学变量存储了吗，我就用变量存储呗，呵呵，不嫌累吗，同学，如班里有一百个人，你就得创建一百个变量啊，消耗大，效率低。

又有同学说，我用个大字符串不可以吗，没问题，你的确存起来了，但是，你对这个数据的操作（增删改查）将变得非常艰难，不是吗，我想知道张三的位置，你怎么办？

在这种需求下，编程语言有了一个重要的数据类型－－－－列表（list）

什么是列表：

列表（list）是Python以及其他语言中最常用到的数据结构之一。Python使用使用中括号 [ ] 来解析列表。列表是可变的（mutable）——可以改变列表的内容。

对应操作：

1 查（［］）

 
                 names_class2 
                 = 
                 [ 
                 '张三' 
                 , 
                 '李四' 
                 , 
                 '王五' 
                 , 
                 '赵六' 
                 ] 
                
                 # print(names_class2[2]) 
                
                 # print(names_class2[0:3]) 
                
                 # print(names_class2[0:7]) 
                
                 # print(names_class2[-1]) 
                
                 # print(names_class2[2:3]) 
                
                 # print(names_class2[0:3:1]) 
                
                 # print(names_class2[3:0:-1]) 
                
                 # print(names_class2[:])

2 增（append，insert）

insert 方法用于将对象插入到列表中，而append方法则用于在列表末尾追加新的对象

 
                 names_class2.append( 
                 'alex' 
                 ) 
                
                 names_class2.insert( 
                 2 
                 , 
                 'alvin' 
                 ) 
                
                 print 
                 (names_class2)

3 改（重新赋值）

 
            
             
               
               
                 names_class2 
                 = 
                 [ 
                 '张三' 
                 , 
                 '李四' 
                 , 
                 '王五' 
                 , 
                 '赵六' 
                 ] 
                

                    
                
 
                 names_class2[ 
                 3 
                 ] 
                 = 
                 '赵七' 
                
 
                 names_class2[ 
                 0 
                 : 
                 2 
                 ] 
                 = 
                 [ 
                 'wusir' 
                 , 
                 'alvin' 
                 ] 
                
 
                 print 
                 (names_class2) 
                
 
             
 
            
          

4 删（remove，del，pop）

 
                 names_class2.remove( 
                 'alex' 
                 ) 
                
                 del  
                 names_class2[ 
                 0 
                 ] 
                
                 del  
                 names_class2 
                
                 names_class2.pop() 
                 #注意,pop是有一个返回值的

5 其他操作

5.1 count

count 方法统计某个元素在列表中出现的次数：

 
            
             
               
               
                 >>> [ 
                 'to' 
                 ,  
                 'be' 
                 ,  
                 'or' 
                 ,  
                 'not' 
                 ,  
                 'to' 
                 ,  
                 'be' 
                 ].count( 
                 'to' 
                 )  
                
 
                 2  
                
 
                 >>> x  
                 =  
                 [[ 
                 1 
                 , 
                 2 
                 ],  
                 1 
                 ,  
                 1 
                 , [ 
                 2 
                 ,  
                 1 
                 , [ 
                 1 
                 ,  
                 2 
                 ]]]  
                
 
                 >>> x.count( 
                 1 
                 )  
                
 
                 2  
                
 
                 >>> x.count([ 
                 1 
                 , 
                 2 
                 ])  
                
 
                 1 
                
 
             
 
            
          

5.2 extend

extend 方法可以在列表的末尾一次性追加另一个序列中的多个值。

 
            
             
               
               
                 >>> a  
                 =  
                 [ 
                 1 
                 ,  
                 2 
                 ,  
                 3 
                 ]  
                
 
                 >>> b  
                 =  
                 [ 
                 4 
                 ,  
                 5 
                 ,  
                 6 
                 ]  
                
 
                 >>> a.extend(b)  
                
 
                 >>> a  
                
 
                 [ 
                 1 
                 ,  
                 2 
                 ,  
                 3 
                 ,  
                 4 
                 ,  
                 5 
                 ,  
                 6 
                 ]  
                
 
             
 
            
          

　　extend 方法修改了被扩展的列表，而原始的连接操作（+）则不然，它会返回一个全新的列表。

 
            
             
               
               
                 >>> a  
                 =  
                 [ 
                 1 
                 ,  
                 2 
                 ,  
                 3 
                 ]  
                
 
                 >>> b  
                 =  
                 [ 
                 4 
                 ,  
                 5 
                 ,  
                 6 
                 ]  
                
 
                 >>> a.extend(b)  
                
 
                 >>> a  
                
 
                 [ 
                 1 
                 ,  
                 2 
                 ,  
                 3 
                 ,  
                 4 
                 ,  
                 5 
                 ,  
                 6 
                 ]  
                
 
                 >>>  
                
 
                 >>> a  
                 +  
                 b  
                
 
                 [ 
                 1 
                 ,  
                 2 
                 ,  
                 3 
                 ,  
                 4 
                 ,  
                 5 
                 ,  
                 6 
                 ,  
                 4 
                 ,  
                 5 
                 ,  
                 6 
                 ]  
                
 
                 >>> a  
                
 
                 [ 
                 1 
                 ,  
                 2 
                 ,  
                 3 
                 ,  
                 4 
                 ,  
                 5 
                 ,  
                 6 
                 ]  
                
 
             
 
            
          

5.3 index

index 方法用于从列表中找出某个值第一个匹配项的索引位置：　

 
                 names_class2.index( 
                 '李四' 
                 )

5.4 reverse

reverse 方法将列表中的元素反向存放。

 
                 names_class2.reverse() 
                
                 print 
                 (names_class2)

5.5 sort

sort 方法用于在原位置对列表进行排序。

 
                 x  
                 =  
                 [ 
                 4 
                 ,  
                 6 
                 ,  
                 2 
                 ,  
                 1 
                 ,  
                 7 
                 ,  
                 9 
                 ] 
                
                 x.sort() 
                 #x.sort(reverse=True)

5.6 深浅拷贝

现在，大家先不要理会什么是深浅拷贝，听我说，对于一个列表，我想复制一份怎么办呢？

肯定会有同学说，重新赋值呗：

 
            
             
               
               
                 names_class1 
                 = 
                 [ 
                 '张三' 
                 , 
                 '李四' 
                 , 
                 '王五' 
                 , 
                 '赵六' 
                 ] 
                
 
                 names_class1_copy 
                 = 
                 [ 
                 '张三' 
                 , 
                 '李四' 
                 , 
                 '王五' 
                 , 
                 '赵六' 
                 ] 
                
 
             
 
            
          

这是两块独立的内存空间

这也没问题，还是那句话，如果列表内容做够大，你真的可以要每一个元素都重新写一遍吗？当然不啦，所以列表里为我们内置了copy方法：

 
                 names_class1 
                 = 
                 [ 
                 '张三' 
                 , 
                 '李四' 
                 , 
                 '王五' 
                 , 
                 '赵六' 
                 ,[ 
                 1 
                 , 
                 2 
                 , 
                 3 
                 ]] 
                
                 names_class1_copy 
                 = 
                 names_class1.copy() 
                
                 names_class1[ 
                 0 
                 ] 
                 = 
                 'zhangsan' 
                
                 print 
                 (names_class1) 
                
                 print 
                 (names_class1_copy) 
                
                 ############ 
                
                 names_class1[ 
                 4 
                 ][ 
                 2 
                 ] 
                 = 
                 5 
                
                 print 
                 (names_class1) 
                
                 print 
                 (names_class1_copy) 
                
                 #问题来了,为什么names_class1_copy,从这一点我们可以断定,这两个变量并不是完全独立的,那他们的关系是什么呢?为什么有的改变,有的不改变呢?

这里就涉及到我们要讲的深浅拷贝了：

 
            
             
               
               
                 #不可变数据类型:数字,字符串,元组         可变类型:列表,字典 
                

                    
                
 
                 # l=[2,2,3] 
                
 
                 # print(id(l)) 
                
 
                 # l[0]=5 
                
 
                 # print(id(l))   # 当你对可变类型进行修改时,比如这个列表对象l,它的内存地址不会变化,注意是这个列表对象l,不是它里面的元素 
                
 
                 #                # this is the most important 
                
 
                 # 
                
 
                 # s='alex' 
                
 
                 # print(id(s))   #像字符串,列表,数字这些不可变数据类型,,是不能修改的,比如我想要一个'Alex'的字符串,只能重新创建一个'Alex'的对象,然后让指针只想这个新对象 
                
 
                 # 
                
 
                 # s[0]='e'       #报错 
                
 
                 # print(id(s)) 
                

                    
                
 
                 #重点:浅拷贝 
                
 
                 a 
                 = 
                 [[ 
                 1 
                 , 
                 2 
                 ], 
                 3 
                 , 
                 4 
                 ] 
                
 
                 b 
                 = 
                 a[:] 
                 #b=a.copy() 
                

                    
                
 
                 print 
                 (a,b) 
                
 
                 print 
                 ( 
                 id 
                 (a), 
                 id 
                 (b)) 
                
 
                 print 
                 ( 
                 '*************' 
                 ) 
                
 
                 print 
                 ( 
                 'a[0]:' 
                 , 
                 id 
                 (a[ 
                 0 
                 ]), 
                 'b[0]:' 
                 , 
                 id 
                 (b[ 
                 0 
                 ])) 
                
 
                 print 
                 ( 
                 'a[0][0]:' 
                 , 
                 id 
                 (a[ 
                 0 
                 ][ 
                 0 
                 ]), 
                 'b[0][0]:' 
                 , 
                 id 
                 (b[ 
                 0 
                 ][ 
                 0 
                 ])) 
                
 
                 print 
                 ( 
                 'a[0][1]:' 
                 , 
                 id 
                 (a[ 
                 0 
                 ][ 
                 1 
                 ]), 
                 'b[0][1]:' 
                 , 
                 id 
                 (b[ 
                 0 
                 ][ 
                 1 
                 ])) 
                
 
                 print 
                 ( 
                 'a[1]:' 
                 , 
                 id 
                 (a[ 
                 1 
                 ]), 
                 'b[1]:' 
                 , 
                 id 
                 (b[ 
                 1 
                 ])) 
                
 
                 print 
                 ( 
                 'a[2]:' 
                 , 
                 id 
                 (a[ 
                 2 
                 ]), 
                 'b[2]:' 
                 , 
                 id 
                 (b[ 
                 2 
                 ])) 
                

                    
                

                    
                
 
                 print 
                 ( 
                 '___________________________________________' 
                 ) 
                
 
                 b[ 
                 0 
                 ][ 
                 0 
                 ] 
                 = 
                 8 
                

                    
                
 
                 print 
                 (a,b) 
                
 
                 print 
                 ( 
                 id 
                 (a), 
                 id 
                 (b)) 
                
 
                 print 
                 ( 
                 '*************' 
                 ) 
                
 
                 print 
                 ( 
                 'a[0]:' 
                 , 
                 id 
                 (a[ 
                 0 
                 ]), 
                 'b[0]:' 
                 , 
                 id 
                 (b[ 
                 0 
                 ])) 
                
 
                 print 
                 ( 
                 'a[0][0]:' 
                 , 
                 id 
                 (a[ 
                 0 
                 ][ 
                 0 
                 ]), 
                 'b[0][0]:' 
                 , 
                 id 
                 (b[ 
                 0 
                 ][ 
                 0 
                 ])) 
                
 
                 print 
                 ( 
                 'a[0][1]:' 
                 , 
                 id 
                 (a[ 
                 0 
                 ][ 
                 1 
                 ]), 
                 'b[0][1]:' 
                 , 
                 id 
                 (b[ 
                 0 
                 ][ 
                 1 
                 ])) 
                
 
                 print 
                 ( 
                 'a[1]:' 
                 , 
                 id 
                 (a[ 
                 1 
                 ]), 
                 'b[1]:' 
                 , 
                 id 
                 (b[ 
                 1 
                 ])) 
                
 
                 print 
                 ( 
                 'a[2]:' 
                 , 
                 id 
                 (a[ 
                 2 
                 ]), 
                 'b[2]:' 
                 , 
                 id 
                 (b[ 
                 2 
                 ]))<br><br><br> 
                 #outcome 
                
 
             
 
            
          

# [[1, 2], 3, 4] [[1, 2], 3, 4]
# 4331943624 4331943752
# *************
# a[0]: 4331611144 b[0]: 4331611144
# a[0][0]: 4297375104 b[0][0]: 4297375104
# a[0][1]: 4297375136 b[0][1]: 4297375136
# a[1]: 4297375168 b[1]: 4297375168
# a[2]: 4297375200 b[2]: 4297375200
# ___________________________________________
# [[8, 2], 3, 4] [[8, 2], 3, 4]
# 4331943624 4331943752
# *************
# a[0]: 4331611144 b[0]: 4331611144
# a[0][0]: 4297375328 b[0][0]: 4297375328
# a[0][1]: 4297375136 b[0][1]: 4297375136
# a[1]: 4297375168 b[1]: 4297375168
# a[2]: 4297375200 b[2]: 4297375200

那么怎么解释这样的一个结果呢？

再不懂，俺就没办法啦...

列表补充：

b,*c=[1,2,3,4,5]

六 tuple（元组）

元组被称为只读列表，即数据可以被查询，但不能被修改，所以，列表的切片操作同样适用于元组。

元组写在小括号(())里，元素之间用逗号隔开。

虽然tuple的元素不可改变，但它可以包含可变的对象，比如list列表。

构造包含 0 个或 1 个元素的元组比较特殊，所以有一些额外的语法规则：

 
                 tup1  
                 =  
                 ()     
                 # 空元组 
                
                 tup2  
                 =  
                 ( 
                 20 
                 ,)  
                 # 一个元素，需要在元素后添加逗号

作用：

1 对于一些数据我们不想被修改，可以使用元组；

2 另外，元组的意义还在于，元组可以在映射（和集合的成员）中当作键使用——而列表则不行；元组作为很多内建函数和方法的返回值存在。

字典

购物车实例

七 Dictionary（字典）

字典是python中唯一的映射类型，采用键值对（key-value）的形式存储数据。python对key进行哈希函数运算，根据计算的结果决定value的存储地址，所以字典是无序存储的，且key必须是可哈希的。可哈希表示key必须是不可变类型，如：数字、字符串、元组。

字典(dictionary)是除列表意外python之中最灵活的内置数据结构类型。列表是有序的对象结合，字典是无序的对象集合。两者之间的区别在于：字典当中的元素是通过键来存取的，而不是通过偏移存取。

创建字典：

对应操作：

1 增

 
                 dic3 
                 = 
                 {} 
                
                 dic3[ 
                 'name' 
                 ] 
                 = 
                 'alex' 
                
                 dic3[ 
                 'age' 
                 ] 
                 = 
                 18 
                
                 print 
                 (dic3) 
                 #{'name': 'alex', 'age': 18} 
                
                 a 
                 = 
                 dic3.setdefault( 
                 'name' 
                 , 
                 'yuan' 
                 ) 
                
                 b 
                 = 
                 dic3.setdefault( 
                 'ages' 
                 , 
                 22 
                 ) 
                
                 print 
                 (a,b) 
                
                 print 
                 (dic3)

2 查

 
                 dic3 
                 = 
                 { 
                 'name' 
                 :  
                 'alex' 
                 ,  
                 'age' 
                 :  
                 18 
                 } 
                
                 # print(dic3['name']) 
                
                 # print(dic3['names']) 
                
                 # 
                
                 # print(dic3.get('age',False)) 
                
                 # print(dic3.get('ages',False)) 
                
                 print 
                 (dic3.items()) 
                
                 print 
                 (dic3.keys()) 
                
                 print 
                 (dic3.values()) 
                
                 print 
                 ( 
                 'name'  
                 in  
                 dic3) 
                 # py2:  dic3.has_key('name') 
                
                 print 
                 ( 
                 list 
                 (dic3.values()))

3 改

 
            
             
               
               
                 dic3 
                 = 
                 { 
                 'name' 
                 :  
                 'alex' 
                 ,  
                 'age' 
                 :  
                 18 
                 } 
                

                    
                
 
                 dic3[ 
                 'name' 
                 ] 
                 = 
                 'alvin' 
                
 
                 dic4 
                 = 
                 { 
                 'sex' 
                 : 
                 'male' 
                 , 
                 'hobby' 
                 : 
                 'girl' 
                 , 
                 'age' 
                 : 
                 36 
                 } 
                
 
                 dic3.update(dic4) 
                
 
                 print 
                 (dic3) 
                
 
             
 
            
          

4 删

 
                 dic4 
                 = 
                 { 
                 'name' 
                 :  
                 'alex' 
                 ,  
                 'age' 
                 :  
                 18 
                 , 
                 'class' 
                 : 
                 1 
                 } 
                
                 # dic4.clear() 
                
                 # print(dic4) 
                
                 del  
                 dic4[ 
                 'name' 
                 ] 
                
                 print 
                 (dic4) 
                
                 a 
                 = 
                 dic4.popitem() 
                
                 print 
                 (a,dic4) 
                
                 # print(dic4.pop('age')) 
                
                 # print(dic4) 
                
                 # del dic4 
                
                 # print(dic4)

5 其他操作以及涉及到的方法

5.1 dict.fromkeys

 
            
             
               
               
                 d1 
                 = 
                 dict 
                 .fromkeys([ 
                 'host1' 
                 , 
                 'host2' 
                 , 
                 'host3' 
                 ], 
                 'Mac' 
                 ) 
                
 
                 print 
                 (d1) 
                

                    
                
 
                 d1[ 
                 'host1' 
                 ] 
                 = 
                 'xiaomi' 
                
 
                 print 
                 (d1) 
                
 
                 ####### 
                
 
                 d2 
                 = 
                 dict 
                 .fromkeys([ 
                 'host1' 
                 , 
                 'host2' 
                 , 
                 'host3' 
                 ],[ 
                 'Mac' 
                 , 
                 'huawei' 
                 ]) 
                
 
                 print 
                 (d2) 
                
 
                 d2[ 
                 'host1' 
                 ][ 
                 0 
                 ] 
                 = 
                 'xiaomi' 
                
 
                 print 
                 (d2) 
                
 
             
 
            
          

5.2 d.copy() 对字典 d 进行浅复制，返回一个和d有相同键值对的新字典

5.3 字典的嵌套

View Code

5.4 sorted(dict) : 返回一个有序的包含字典所有key的列表

5.5 字典的遍历　　

 
                 dic5 
                 = 
                 { 
                 'name' 
                 :  
                 'alex' 
                 ,  
                 'age' 
                 :  
                 18 
                 } 
                
                 for  
                 i  
                 in  
                 dic5: 
                
                 print 
                 (i,dic5[i]) 
                
                 for  
                 items  
                 in  
                 dic5.items(): 
                
                 print 
                 (items) 
                
                 for  
                 keys,values  
                 in  
                 dic5.items(): 
                
                 print 
                 (keys,values)

还用我们上面的例子，存取这个班学生的信息，我们如果通过字典来完成，那：

八集合(set)

集合是一个无序的，不重复的数据组合，它的主要作用如下：

去重，把一个列表变成集合，就自动去重了
关系测试，测试两组数据之前的交集、差集、并集等关系

集合(set)：把不同的元素组成一起形成集合，是python基本的数据类型。

集合元素(set elements):组成集合的成员(不可重复)

 
            
             
               
               
                 li 
                 = 
                 [ 
                 1 
                 , 
                 2 
                 , 
                 'a' 
                 , 
                 'b' 
                 ] 
                
 
                 s  
                 = 
                 set 
                 (li) 
                
 
                 print 
                 (s)     
                 # {1, 2, 'a', 'b'} 
                

                    
                
 
                 li2 
                 = 
                 [ 
                 1 
                 , 
                 2 
                 , 
                 1 
                 , 
                 'a' 
                 , 
                 'a' 
                 ] 
                
 
                 s 
                 = 
                 set 
                 (li2) 
                
 
                 print 
                 (s)   
                 #{1, 2, 'a'} 
                
 
             
 
            
          

集合对象是一组无序排列的可哈希的值：集合成员可以做字典的键　

 
                 li 
                 = 
                 [[ 
                 1 
                 , 
                 2 
                 ], 
                 'a' 
                 , 
                 'b' 
                 ] 
                
                 s  
                 = 
                 set 
                 (li)  
                 #TypeError: unhashable type: 'list' 
                
                 print 
                 (s)

集合分类：可变集合、不可变集合

可变集合(set)：可添加和删除元素，非可哈希的，不能用作字典的键，也不能做其他集合的元素

不可变集合(frozenset)：与上面恰恰相反

 
                 li 
                 = 
                 [ 
                 1 
                 , 
                 'a' 
                 , 
                 'b' 
                 ] 
                
                 s  
                 = 
                 set 
                 (li) 
                
                 dic 
                 = 
                 {s: 
                 '123' 
                 }  
                 #TypeError: unhashable type: 'set'

集合的相关操作　　

1、创建集合

由于集合没有自己的语法格式，只能通过集合的工厂方法set()和frozenset()创建

 
                 s1  
                 =  
                 set 
                 ( 
                 'alvin' 
                 ) 
                
                 s2 
                 =  
                 frozenset 
                 ( 
                 'yuan' 
                 ) 
                
                 print 
                 (s1, 
                 type 
                 (s1))   
                 #{'l', 'v', 'i', 'a', 'n'} <class 'set'> 
                
                 print 
                 (s2, 
                 type 
                 (s2))   
                 #frozenset({'n', 'y', 'a', 'u'}) <class 'frozenset'>

2、访问集合

由于集合本身是无序的，所以不能为集合创建索引或切片操作，只能循环遍历或使用in、not in来访问或判断集合元素。

 
                 s1  
                 =  
                 set 
                 ( 
                 'alvin' 
                 ) 
                
                 print 
                 ( 
                 'a'  
                 in  
                 s1) 
                
                 print 
                 ( 
                 'b'  
                 in  
                 s1) 
                
                 #s1[1]  #TypeError: 'set' object does not support indexing 
                
                 for  
                 i  
                 in  
                 s1: 
                
                 print 
                 (i) 
                
                 #     
                
                 # True 
                
                 # False 
                
                 # v 
                
                 # n 
                
                 # l 
                
                 # i 
                
                 # a

3、更新集合

可使用以下内建方法来更新：

s.add()
s.update()
s.remove()

注意只有可变集合才能更新：

 
                 # s1 = frozenset('alvin') 
                
                 # s1.add(0)  #AttributeError: 'frozenset' object has no attribute 'add' 
                
                 s2 
                 = 
                 set 
                 ( 
                 'alvin' 
                 ) 
                
                 s2.add( 
                 'mm' 
                 ) 
                
                 print 
                 (s2)   
                 #{'mm', 'l', 'n', 'a', 'i', 'v'} 
                
                 s2.update( 
                 'HO' 
                 ) 
                 #添加多个元素 
                
                 print 
                 (s2)   
                 #{'mm', 'l', 'n', 'a', 'i', 'H', 'O', 'v'} 
                
                 s2.remove( 
                 'l' 
                 ) 
                
                 print 
                 (s2)   
                 #{'mm', 'n', 'a', 'i', 'H', 'O', 'v'}

del：删除集合本身　

四、集合类型操作符　

1 in ,not in
2 集合等价与不等价(==, !=)
3 子集、超集

 
                 s 
                 = 
                 set 
                 ( 
                 'alvinyuan' 
                 ) 
                
                 s1 
                 = 
                 set 
                 ( 
                 'alvin' 
                 ) 
                
                 print 
                 ( 
                 'v'  
                 in  
                 s) 
                
                 print 
                 (s1<s)

4 联合(|)

联合(union)操作与集合的or操作其实等价的，联合符号有个等价的方法，union()。

 
                 s1 
                 = 
                 set 
                 ( 
                 'alvin' 
                 ) 
                
                 s2 
                 = 
                 set 
                 ( 
                 'yuan' 
                 ) 
                
                 s3 
                 = 
                 s1|s2 
                
                 print 
                 (s3)   
                 #{'a', 'l', 'i', 'n', 'y', 'v', 'u'} 
                
                 print 
                 (s1.union(s2))  
                 #{'a', 'l', 'i', 'n', 'y', 'v', 'u'}

5、交集(&)

与集合and等价，交集符号的等价方法是intersection()

 
                 s1 
                 = 
                 set 
                 ( 
                 'alvin' 
                 ) 
                
                 s2 
                 = 
                 set 
                 ( 
                 'yuan' 
                 ) 
                
                 s3 
                 = 
                 s1&s2 
                
                 print 
                 (s3)   
                 #{'n', 'a'} 
                
                 print 
                 (s1.intersection(s2))  
                 #{'n', 'a'}

　　6、查集(-)
等价方法是difference()

 
                 s1 
                 = 
                 set 
                 ( 
                 'alvin' 
                 ) 
                
                 s2 
                 = 
                 set 
                 ( 
                 'yuan' 
                 ) 
                
                 s3 
                 = 
                 s1 
                 - 
                 s2 
                
                 print 
                 (s3)   
                 #{'v', 'i', 'l'} 
                
                 print 
                 (s1.difference(s2))  
                 #{'v', 'i', 'l'}

7、对称差集(^)

对称差分是集合的XOR(‘异或’)，取得的元素属于s1,s2但不同时属于s1和s2.其等价方法symmetric_difference()

 
                 s1 
                 = 
                 set 
                 ( 
                 'alvin' 
                 ) 
                
                 s2 
                 = 
                 set 
                 ( 
                 'yuan' 
                 ) 
                
                 s3 
                 = 
                 s1^s2 
                
                 print 
                 (s3)   
                 #{'l', 'v', 'y', 'u', 'i'} 
                
                 print 
                 (s1.symmetric_difference(s2))  
                 #{'l', 'v', 'y', 'u', 'i'}

应用

 
            
             
               
               
                 '''最简单的去重方式''' 
                
 
                 lis  
                 =  
                 [ 
                 1 
                 , 
                 2 
                 , 
                 3 
                 , 
                 4 
                 , 
                 1 
                 , 
                 2 
                 , 
                 3 
                 , 
                 4 
                 ] 
                
 
                 print  
                 list 
                 ( 
                 set 
                 (lis))     
                 #[1, 2, 3, 4] 
                
 
             
 
            
          

九文件操作

9.1 对文件操作流程

打开文件，得到文件句柄并赋值给一个变量
通过句柄对文件进行操作
关闭文件

现有文件如下：

 
                 昨夜寒蛩不住鸣。 
                
                 惊回千里梦，已三更。 
                
                 起来独自绕阶行。 
                
                 人悄悄，帘外月胧明。 
                
                 白首为功名，旧山松竹老，阻归程。 
                
                 欲将心事付瑶琴。 
                
                 知音少，弦断有谁听。

注意 if in the win，hello文件是utf8保存的，打开文件时open函数是通过操作系统打开的文件，而win操作系统

默认的是gbk编码，所以直接打开会乱码，需要f=open('hello',encoding='utf8')，hello文件如果是gbk保存的，则直接打开即可。

9.2 文件打开模式　　

 
            
             
               
               
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 =  
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                
 
                      
                 Character Meaning 
                
 
                      
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 -  
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                 - 
                
 
                      
                 'r'        
                 open  
                 for  
                 reading (default) 
                
 
                      
                 'w'        
                 open  
                 for  
                 writing, truncating the  
                 file  
                 first 
                
 
                      
                 'x'        
                 create a new  
                 file  
                 and  
                 open  
                 it  
                 for  
                 writing 
                
 
                      
                 'a'        
                 open  
                 for  
                 writing, appending to the end of the  
                 file  
                 if  
                 it exists 
                
 
                      
                 'b'        
                 binary mode 
                
 
                      
                 't'        
                 text mode (default) 
                
 
                      
                 '+'        
                 open  
                 a disk  
                 file  
                 for  
                 updating (reading  
                 and  
                 writing) 
                
 
                      
                 'U'        
                 universal newline mode (deprecated) 
                
 
                      
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 =  
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                 = 
                
 
             
 
            
          

先介绍三种最基本的模式：

 
                 # f = open('小重山2','w') #打开文件 
                
                 # f = open('小重山2','a') #打开文件 
                
                 # f.write('莫等闲1\n') 
                
                 # f.write('白了少年头2\n') 
                
                 # f.write('空悲切!3')

9.3 文件具体操作

操作方法介绍

 
                 f  
                 =  
                 open 
                 ( 
                 '小重山' 
                 )  
                 #打开文件 
                
                 # data1=f.read()#获取文件内容 
                
                 # data2=f.read()#获取文件内容 
                
                 # 
                
                 # print(data1) 
                
                 # print('...',data2) 
                
                 # data=f.read(5)#获取文件内容 
                
                 # data=f.readline() 
                
                 # data=f.readline() 
                
                 # print(f.__iter__().__next__()) 
                
                 # for i in range(5): 
                
                 #     print(f.readline()) 
                
                 # data=f.readlines() 
                
                 # for line in f.readlines(): 
                
                 #     print(line) 
                
                 # 问题来了:打印所有行,另外第3行后面加上:'end 3' 
                
                 # for index,line in enumerate(f.readlines()): 
                
                 #     if index==2: 
                
                 #         line=''.join([line.strip(),'end 3']) 
                
                 #     print(line.strip()) 
                
                 #切记:以后我们一定都用下面这种 
                
                 # count=0 
                
                 # for line in f: 
                
                 #     if count==3: 
                
                 #         line=''.join([line.strip(),'end 3']) 
                
                 #     print(line.strip()) 
                
                 #     count+=1 
                
                 # print(f.tell()) 
                
                 # print(f.readline()) 
                
                 # print(f.tell())#tell对于英文字符就是占一个,中文字符占三个,区分与read()的不同. 
                
                 # print(f.read(5))#一个中文占三个字符 
                
                 # print(f.tell()) 
                
                 # f.seek(0) 
                
                 # print(f.read(6))#read后不管是中文字符还是英文字符,都统一算一个单位,read(6),此刻就读了6个中文字符 
                
                 #terminal上操作: 
                
                 f  
                 =  
                 open 
                 ( 
                 '小重山2' 
                 , 
                 'w' 
                 ) 
                
                 # f.write('hello \n') 
                
                 # f.flush() 
                
                 # f.write('world') 
                
                 # 应用:进度条 
                
                 # import time,sys 
                
                 # for i in range(30): 
                
                 #     sys.stdout.write("*") 
                
                 #     # sys.stdout.flush() 
                
                 #     time.sleep(0.1) 
                
                 # f = open('小重山2','w') 
                
                 # f.truncate()#全部截断 
                
                 # f.truncate(5)#全部截断 
                
                 # print(f.isatty()) 
                
                 # print(f.seekable()) 
                
                 # print(f.readable()) 
                
                 f.close()  
                 #关闭文件

接下来我们继续扩展文件模式：

 
                 # f = open('小重山2','w') #打开文件 
                
                 # f = open('小重山2','a') #打开文件 
                
                 # f.write('莫等闲1\n') 
                
                 # f.write('白了少年头2\n') 
                
                 # f.write('空悲切!3') 
                
                 # f.close() 
                
                 #r+,w+模式 
                
                 # f = open('小重山2','r+') #以读写模式打开文件 
                
                 # print(f.read(5))#可读 
                
                 # f.write('hello') 
                
                 # print('------') 
                
                 # print(f.read()) 
                
                 # f = open('小重山2','w+') #以写读模式打开文件 
                
                 # print(f.read(5))#什么都没有,因为先格式化了文本 
                
                 # f.write('hello alex') 
                
                 # print(f.read())#还是read不到 
                
                 # f.seek(0) 
                
                 # print(f.read()) 
                
                 #w+与a+的区别在于是否在开始覆盖整个文件 
                
                 # ok,重点来了,我要给文本第三行后面加一行内容:'hello 岳飞!' 
                
                 # 有同学说,前面不是做过修改了吗? 大哥,刚才是修改内容后print,现在是对文件进行修改!!! 
                
                 # f = open('小重山2','r+') #以写读模式打开文件 
                
                 # f.readline() 
                
                 # f.readline() 
                
                 # f.readline() 
                
                 # print(f.tell()) 
                
                 # f.write('hello 岳飞') 
                
                 # f.close() 
                
                 # 和想的不一样,不管事!那涉及到文件修改怎么办呢? 
                
                 # f_read = open('小重山','r') #以写读模式打开文件 
                
                 # f_write = open('小重山_back','w') #以写读模式打开文件 
                
                 # count=0 
                
                 # for line in f_read: 
                
                 # if count==3: 
                
                 #     f_write.write('hello,岳飞\n') 
                
                 # 
                
                 # else: 
                
                 #     f_write.write(line) 
                
                 # another way: 
                
                 # if count==3: 
                
                 # 
                
                 #     line='hello,岳飞2\n' 
                
                 # f_write.write(line) 
                
                 # count+=1 
                
                 # #二进制模式 
                
                 # f = open('小重山2','wb') #以二进制的形式读文件 
                
                 # # f = open('小重山2','wb') #以二进制的形式写文件 
                
                 # f.write('hello alvin!'.encode())#b'hello alvin!'就是一个二进制格式的数据,只是为了观看,没有显示成010101的形式

注意1: 无论是py2还是py3，在r+模式下都可以等量字节替换，但没有任何意义的！　

注意2：有同学在这里会用readlines得到内容列表，再通过索引对相应内容进行修改，最后将列表重新写会该文件。

这种思路有一个很大的问题，数据若很大，你的内存会受不了的，而我们的方式则可以通过迭代器来优化这个过程。　

补充：rb模式以及seek

在py2中：

 
                 #昨夜寒蛩不住鸣. 
                
                 f  
                 =  
                 open 
                 ( 
                 'test' 
                 , 
                 'r' 
                 ,)  
                 #以写读模式打开文件 
                
                 f.read( 
                 3 
                 ) 
                
                 # f.seek(3) 
                
                 # print f.read(3) # 夜 
                
                 # f.seek(3,1) 
                
                 # print f.read(3) # 寒 
                
                 # f.seek(-4,2) 
                
                 # print f.read(3) # 鸣

在py3中：

# test: 
昨夜寒蛩不住鸣.

f = open('test','rb',) #以写读模式打开文件

f.read(3)

# f.seek(3)
# print(f.read(3)) # b'\xe5\xa4\x9c'

# f.seek(3,1)
# print(f.read(3)) # b'\xe5\xaf\x92'

# f.seek(-4,2)
# print(f.read(3))   # b'\xe9\xb8\xa3'

#总结: 在py3中,如果你想要字符数据,即用于观看的,则用r模式,这样我f.read到的数据是一个经过decode的
#     unicode数据; 但是如果这个数据我并不需要看,而只是用于传输,比如文件上传,那么我并不需要decode
#     直接传送bytes就好了,所以这个时候用rb模式.

#     在py3中,有一条严格的线区分着bytes和unicode,比如seek的用法,在py2和py3里都是一个个字节的seek,
#     但在py3里你就必须声明好了f的类型是rb,不允许再模糊.

#建议: 以后再读写文件的时候直接用rb模式,需要decode的时候仔显示地去解码.

9.4 with语句

为了避免打开文件后忘记关闭，可以通过管理上下文，即：

如此方式，当with代码块执行完毕时，内部会自动关闭并释放文件资源。

在Python 2.7 后，with又支持同时对多个文件的上下文进行管理，即：

数据类型

一 Number(数字)

1.1 数字类型的创建

注意这里与C的不同：

 
         #include <stdio.h> 
        
         void main(void) 
        
         { 
        
         int  
         a  
         =  
         1 
         ; 
        
         int  
         b  
         =  
         a; 
        
         printf ( 
         "a:adr:%p,val:%d,b:adr:%p,val:%d\n" 
         ,&a,a,&b,b); 
        
         a  
         =  
         3 
         ; 
        
         printf ( 
         "a:adr:%p,val:%d,b:adr:%p,val:%d\n" 
         ,&a,a,&b,b); 
        
         } 
        
         / 
         / 
         打印结果： 
        
         topeet@ubuntu:~$ gcc test.c 
        
         topeet@ubuntu:~$ . 
         / 
         a.out 
        
         a:adr: 
         0x7fff343a069c 
         ,val: 
         1 
        
         b:adr: 
         0x7fff343a0698 
         ,val: 
         1 
        
         a:adr: 
         0x7fff343a069c 
         ,val: 
         3 
        
         b:adr: 
         0x7fff343a0698 
         ,val: 
         1

1.2 Number 类型转换

 
         var1 
         = 
         3.14 
        
         var2 
         = 
         5 
        
         var3 
         = 
         int 
         (var1) 
        
         var4 
         = 
         float 
         (var2) 
        
         print 
         (var3,var4)

PY内置数学函数

二字符串类型（string）

字符串是以单引号'或双引号"括起来的任意文本，比如'abc'，"123"等等。

2.1 创建字符串：

 
         var1  
         =  
         'Hello World!' 
        
         var2  
         =  
         "Python RAlvin"

对应操作：

 
         # 1   * 重复输出字符串 
        
         print 
         ( 
         'hello' 
         * 
         2 
         ) 
        
         # 2 [] ,[:] 通过索引获取字符串中字符,这里和列表的切片操作是相同的,具体内容见列表 
        
         print 
         ( 
         'helloworld' 
         [ 
         2 
         :]) 
        
         # 3 in  成员运算符 - 如果字符串中包含给定的字符返回 True 
        
         print 
         ( 
         'el'  
         in  
         'hello' 
         ) 
        
         # 4 %   格式字符串 
        
         print 
         ( 
         'alex is a good teacher' 
         ) 
        
         print 
         ( 
         '%s is a good teacher' 
         % 
         'alex' 
         ) 
        
         # 5 +   字符串拼接 
        
         a 
         = 
         '123' 
        
         b 
         = 
         'abc' 
        
         c 
         = 
         '789' 
        
         d1 
         = 
         a 
         + 
         b 
         + 
         c 
        
         print 
         (d1) 
        
         # +效率低,该用join 
        
         d2 
         = 
         ''.join([a,b,c]) 
        
         print 
         (d2)

python的内置方法

View Code

三字节类型(bytes)

 
         # a=bytes('hello','utf8') 
        
         # a=bytes('中国','utf8') 
        
         a 
         = 
         bytes( 
         '中国' 
         , 
         'utf8' 
         ) 
        
         b 
         = 
         bytes( 
         'hello' 
         , 
         'gbk' 
         ) 
        
         # 
        
         print 
         (a)         
         #b'\xe4\xb8\xad\xe5\x9b\xbd' 
        
         print 
         ( 
         ord 
         ( 
         'h' 
         ))  
         #其十进制 unicode 值为: 104 
        
         print 
         ( 
         ord 
         ( 
         '中' 
         )) 
         #其十进制 unicode 值为:20013 
        
         #  h   e  l   l   o 
        
         # 104 101 108 108 111   编码后结果:与ASCII表对应 
        
         #     中                国 
        
         #   \xd6\xd0         \xb9\xfa       gbk编码后的字节结果 
        
         #\xe4 \xb8 \xad   \xe5 \x9b \xbd    utf8编码后的字节结果 
        
         # 228 184 173      229 155  189        a[:]切片取 
        
         c 
         = 
         a.decode( 
         'utf8' 
         ) 
        
         d 
         = 
         b.decode( 
         'gbk' 
         ) 
        
         #b=a.decode('gbk') :很明显报错 
        
         print 
         (c)  
         #中国 
        
         print 
         (d)  
         #hello

 
         b1 
         = 
         b 
         '123' 
        
         print 
         ( 
         type 
         (b1)) 
        
         # b2=b'中国' #报错 
        
         # 所以得这样: 
        
         b2 
         = 
         bytes( 
         '中国' 
         , 
         'utf8' 
         ) 
        
         print 
         (b2) 
         #b'\xe4\xb8\xad\xe5\x9b\xbd'

四布尔值

一个布尔值只有True、False两种值，要么是True，要么是False，在Python中，可以直接用True、False表示布尔值（请注意大小写）

与或非操作：

布尔值经常用在条件判断中:

 
         age 
         = 
         18 
        
         if  
         age> 
         18 
         : 
         #bool(age>18) 
        
         print 
         ( 
         'old' 
         ) 
        
         else 
         : 
        
         print 
         ( 
         'young' 
         )

五 List（列表）

OK,现在我们知道了字符串和整型两个数据类型了，那需求来了，我想把某个班所有的名字存起来，怎么办？

有同学说，不是学变量存储了吗，我就用变量存储呗，呵呵，不嫌累吗，同学，如班里有一百个人，你就得创建一百个变量啊，消耗大，效率低。

在这种需求下，编程语言有了一个重要的数据类型－－－－列表（list）

什么是列表：

列表（list）是Python以及其他语言中最常用到的数据结构之一。Python使用使用中括号 [ ] 来解析列表。列表是可变的（mutable）——可以改变列表的内容。

对应操作：

1 查（［］）

 
         names_class2 
         = 
         [ 
         '张三' 
         , 
         '李四' 
         , 
         '王五' 
         , 
         '赵六' 
         ] 
        
         # print(names_class2[2]) 
        
         # print(names_class2[0:3]) 
        
         # print(names_class2[0:7]) 
        
         # print(names_class2[-1]) 
        
         # print(names_class2[2:3]) 
        
         # print(names_class2[0:3:1]) 
        
         # print(names_class2[3:0:-1]) 
        
         # print(names_class2[:])

2 增（append，insert）

insert 方法用于将对象插入到列表中，而append方法则用于在列表末尾追加新的对象

 
         names_class2.append( 
         'alex' 
         ) 
        
         names_class2.insert( 
         2 
         , 
         'alvin' 
         ) 
        
         print 
         (names_class2)

3 改（重新赋值）

 
    
     
       
       
         names_class2 
         = 
         [ 
         '张三' 
         , 
         '李四' 
         , 
         '王五' 
         , 
         '赵六' 
         ] 
        

            
        
 
         names_class2[ 
         3 
         ] 
         = 
         '赵七' 
        
 
         names_class2[ 
         0 
         : 
         2 
         ] 
         = 
         [ 
         'wusir' 
         , 
         'alvin' 
         ] 
        
 
         print 
         (names_class2) 
        
 
     
 
    
  

4 删（remove，del，pop）

 
         names_class2.remove( 
         'alex' 
         ) 
        
         del  
         names_class2[ 
         0 
         ] 
        
         del  
         names_class2 
        
         names_class2.pop() 
         #注意,pop是有一个返回值的

5 其他操作

5.1 count

count 方法统计某个元素在列表中出现的次数：

 
    
     
       
       
         >>> [ 
         'to' 
         ,  
         'be' 
         ,  
         'or' 
         ,  
         'not' 
         ,  
         'to' 
         ,  
         'be' 
         ].count( 
         'to' 
         )  
        
 
         2  
        
 
         >>> x  
         =  
         [[ 
         1 
         , 
         2 
         ],  
         1 
         ,  
         1 
         , [ 
         2 
         ,  
         1 
         , [ 
         1 
         ,  
         2 
         ]]]  
        
 
         >>> x.count( 
         1 
         )  
        
 
         2  
        
 
         >>> x.count([ 
         1 
         , 
         2 
         ])  
        
 
         1 
        
 
     
 
    
  

5.2 extend

extend 方法可以在列表的末尾一次性追加另一个序列中的多个值。

 
    
     
       
       
         >>> a  
         =  
         [ 
         1 
         ,  
         2 
         ,  
         3 
         ]  
        
 
         >>> b  
         =  
         [ 
         4 
         ,  
         5 
         ,  
         6 
         ]  
        
 
         >>> a.extend(b)  
        
 
         >>> a  
        
 
         [ 
         1 
         ,  
         2 
         ,  
         3 
         ,  
         4 
         ,  
         5 
         ,  
         6 
         ]  
        
 
     
 
    
  

　　extend 方法修改了被扩展的列表，而原始的连接操作（+）则不然，它会返回一个全新的列表。

 
    
     
       
       
         >>> a  
         =  
         [ 
         1 
         ,  
         2 
         ,  
         3 
         ]  
        
 
         >>> b  
         =  
         [ 
         4 
         ,  
         5 
         ,  
         6 
         ]  
        
 
         >>> a.extend(b)  
        
 
         >>> a  
        
 
         [ 
         1 
         ,  
         2 
         ,  
         3 
         ,  
         4 
         ,  
         5 
         ,  
         6 
         ]  
        
 
         >>>  
        
 
         >>> a  
         +  
         b  
        
 
         [ 
         1 
         ,  
         2 
         ,  
         3 
         ,  
         4 
         ,  
         5 
         ,  
         6 
         ,  
         4 
         ,  
         5 
         ,  
         6 
         ]  
        
 
         >>> a  
        
 
         [ 
         1 
         ,  
         2 
         ,  
         3 
         ,  
         4 
         ,  
         5 
         ,  
         6 
         ]  
        
 
     
 
    
  

5.3 index

index 方法用于从列表中找出某个值第一个匹配项的索引位置：　

 
         names_class2.index( 
         '李四' 
         )

5.4 reverse

reverse 方法将列表中的元素反向存放。

 
         names_class2.reverse() 
        
         print 
         (names_class2)

5.5 sort

sort 方法用于在原位置对列表进行排序。

 
         x  
         =  
         [ 
         4 
         ,  
         6 
         ,  
         2 
         ,  
         1 
         ,  
         7 
         ,  
         9 
         ] 
        
         x.sort() 
         #x.sort(reverse=True)

5.6 深浅拷贝

现在，大家先不要理会什么是深浅拷贝，听我说，对于一个列表，我想复制一份怎么办呢？

肯定会有同学说，重新赋值呗：

 
    
     
       
       
         names_class1 
         = 
         [ 
         '张三' 
         , 
         '李四' 
         , 
         '王五' 
         , 
         '赵六' 
         ] 
        
 
         names_class1_copy 
         = 
         [ 
         '张三' 
         , 
         '李四' 
         , 
         '王五' 
         , 
         '赵六' 
         ] 
        
 
     
 
    
  

这是两块独立的内存空间

这也没问题，还是那句话，如果列表内容做够大，你真的可以要每一个元素都重新写一遍吗？当然不啦，所以列表里为我们内置了copy方法：

 
         names_class1 
         = 
         [ 
         '张三' 
         , 
         '李四' 
         , 
         '王五' 
         , 
         '赵六' 
         ,[ 
         1 
         , 
         2 
         , 
         3 
         ]] 
        
         names_class1_copy 
         = 
         names_class1.copy() 
        
         names_class1[ 
         0 
         ] 
         = 
         'zhangsan' 
        
         print 
         (names_class1) 
        
         print 
         (names_class1_copy) 
        
         ############ 
        
         names_class1[ 
         4 
         ][ 
         2 
         ] 
         = 
         5 
        
         print 
         (names_class1) 
        
         print 
         (names_class1_copy) 
        
         #问题来了,为什么names_class1_copy,从这一点我们可以断定,这两个变量并不是完全独立的,那他们的关系是什么呢?为什么有的改变,有的不改变呢?

这里就涉及到我们要讲的深浅拷贝了：

 
    
     
       
       
         #不可变数据类型:数字,字符串,元组         可变类型:列表,字典 
        

            
        
 
         # l=[2,2,3] 
        
 
         # print(id(l)) 
        
 
         # l[0]=5 
        
 
         # print(id(l))   # 当你对可变类型进行修改时,比如这个列表对象l,它的内存地址不会变化,注意是这个列表对象l,不是它里面的元素 
        
 
         #                # this is the most important 
        
 
         # 
        
 
         # s='alex' 
        
 
         # print(id(s))   #像字符串,列表,数字这些不可变数据类型,,是不能修改的,比如我想要一个'Alex'的字符串,只能重新创建一个'Alex'的对象,然后让指针只想这个新对象 
        
 
         # 
        
 
         # s[0]='e'       #报错 
        
 
         # print(id(s)) 
        

            
        
 
         #重点:浅拷贝 
        
 
         a 
         = 
         [[ 
         1 
         , 
         2 
         ], 
         3 
         , 
         4 
         ] 
        
 
         b 
         = 
         a[:] 
         #b=a.copy() 
        

            
        
 
         print 
         (a,b) 
        
 
         print 
         ( 
         id 
         (a), 
         id 
         (b)) 
        
 
         print 
         ( 
         '*************' 
         ) 
        
 
         print 
         ( 
         'a[0]:' 
         , 
         id 
         (a[ 
         0 
         ]), 
         'b[0]:' 
         , 
         id 
         (b[ 
         0 
         ])) 
        
 
         print 
         ( 
         'a[0][0]:' 
         , 
         id 
         (a[ 
         0 
         ][ 
         0 
         ]), 
         'b[0][0]:' 
         , 
         id 
         (b[ 
         0 
         ][ 
         0 
         ])) 
        
 
         print 
         ( 
         'a[0][1]:' 
         , 
         id 
         (a[ 
         0 
         ][ 
         1 
         ]), 
         'b[0][1]:' 
         , 
         id 
         (b[ 
         0 
         ][ 
         1 
         ])) 
        
 
         print 
         ( 
         'a[1]:' 
         , 
         id 
         (a[ 
         1 
         ]), 
         'b[1]:' 
         , 
         id 
         (b[ 
         1 
         ])) 
        
 
         print 
         ( 
         'a[2]:' 
         , 
         id 
         (a[ 
         2 
         ]), 
         'b[2]:' 
         , 
         id 
         (b[ 
         2 
         ])) 
        

            
        

            
        
 
         print 
         ( 
         '___________________________________________' 
         ) 
        
 
         b[ 
         0 
         ][ 
         0 
         ] 
         = 
         8 
        

            
        
 
         print 
         (a,b) 
        
 
         print 
         ( 
         id 
         (a), 
         id 
         (b)) 
        
 
         print 
         ( 
         '*************' 
         ) 
        
 
         print 
         ( 
         'a[0]:' 
         , 
         id 
         (a[ 
         0 
         ]), 
         'b[0]:' 
         , 
         id 
         (b[ 
         0 
         ])) 
        
 
         print 
         ( 
         'a[0][0]:' 
         , 
         id 
         (a[ 
         0 
         ][ 
         0 
         ]), 
         'b[0][0]:' 
         , 
         id 
         (b[ 
         0 
         ][ 
         0 
         ])) 
        
 
         print 
         ( 
         'a[0][1]:' 
         , 
         id 
         (a[ 
         0 
         ][ 
         1 
         ]), 
         'b[0][1]:' 
         , 
         id 
         (b[ 
         0 
         ][ 
         1 
         ])) 
        
 
         print 
         ( 
         'a[1]:' 
         , 
         id 
         (a[ 
         1 
         ]), 
         'b[1]:' 
         , 
         id 
         (b[ 
         1 
         ])) 
        
 
         print 
         ( 
         'a[2]:' 
         , 
         id 
         (a[ 
         2 
         ]), 
         'b[2]:' 
         , 
         id 
         (b[ 
         2 
         ]))<br><br><br> 
         #outcome 
        
 
     
 
    
  

# [[1, 2], 3, 4] [[1, 2], 3, 4]
# 4331943624 4331943752
# *************
# a[0]: 4331611144 b[0]: 4331611144
# a[0][0]: 4297375104 b[0][0]: 4297375104
# a[0][1]: 4297375136 b[0][1]: 4297375136
# a[1]: 4297375168 b[1]: 4297375168
# a[2]: 4297375200 b[2]: 4297375200
# ___________________________________________
# [[8, 2], 3, 4] [[8, 2], 3, 4]
# 4331943624 4331943752
# *************
# a[0]: 4331611144 b[0]: 4331611144
# a[0][0]: 4297375328 b[0][0]: 4297375328
# a[0][1]: 4297375136 b[0][1]: 4297375136
# a[1]: 4297375168 b[1]: 4297375168
# a[2]: 4297375200 b[2]: 4297375200

那么怎么解释这样的一个结果呢？

再不懂，俺就没办法啦...

列表补充：

b,*c=[1,2,3,4,5]

六 tuple（元组）

元组被称为只读列表，即数据可以被查询，但不能被修改，所以，列表的切片操作同样适用于元组。

元组写在小括号(())里，元素之间用逗号隔开。

虽然tuple的元素不可改变，但它可以包含可变的对象，比如list列表。

构造包含 0 个或 1 个元素的元组比较特殊，所以有一些额外的语法规则：

 
         tup1  
         =  
         ()     
         # 空元组 
        
         tup2  
         =  
         ( 
         20 
         ,)  
         # 一个元素，需要在元素后添加逗号

作用：

1 对于一些数据我们不想被修改，可以使用元组；

2 另外，元组的意义还在于，元组可以在映射（和集合的成员）中当作键使用——而列表则不行；元组作为很多内建函数和方法的返回值存在。

字典

购物车实例

七 Dictionary（字典）

创建字典：

对应操作：

1 增

 
         dic3 
         = 
         {} 
        
         dic3[ 
         'name' 
         ] 
         = 
         'alex' 
        
         dic3[ 
         'age' 
         ] 
         = 
         18 
        
         print 
         (dic3) 
         #{'name': 'alex', 'age': 18} 
        
         a 
         = 
         dic3.setdefault( 
         'name' 
         , 
         'yuan' 
         ) 
        
         b 
         = 
         dic3.setdefault( 
         'ages' 
         , 
         22 
         ) 
        
         print 
         (a,b) 
        
         print 
         (dic3)

2 查

 
         dic3 
         = 
         { 
         'name' 
         :  
         'alex' 
         ,  
         'age' 
         :  
         18 
         } 
        
         # print(dic3['name']) 
        
         # print(dic3['names']) 
        
         # 
        
         # print(dic3.get('age',False)) 
        
         # print(dic3.get('ages',False)) 
        
         print 
         (dic3.items()) 
        
         print 
         (dic3.keys()) 
        
         print 
         (dic3.values()) 
        
         print 
         ( 
         'name'  
         in  
         dic3) 
         # py2:  dic3.has_key('name') 
        
         print 
         ( 
         list 
         (dic3.values()))

3 改

 
    
     
       
       
         dic3 
         = 
         { 
         'name' 
         :  
         'alex' 
         ,  
         'age' 
         :  
         18 
         } 
        

            
        
 
         dic3[ 
         'name' 
         ] 
         = 
         'alvin' 
        
 
         dic4 
         = 
         { 
         'sex' 
         : 
         'male' 
         , 
         'hobby' 
         : 
         'girl' 
         , 
         'age' 
         : 
         36 
         } 
        
 
         dic3.update(dic4) 
        
 
         print 
         (dic3) 
        
 
     
 
    
  

4 删

 
         dic4 
         = 
         { 
         'name' 
         :  
         'alex' 
         ,  
         'age' 
         :  
         18 
         , 
         'class' 
         : 
         1 
         } 
        
         # dic4.clear() 
        
         # print(dic4) 
        
         del  
         dic4[ 
         'name' 
         ] 
        
         print 
         (dic4) 
        
         a 
         = 
         dic4.popitem() 
        
         print 
         (a,dic4) 
        
         # print(dic4.pop('age')) 
        
         # print(dic4) 
        
         # del dic4 
        
         # print(dic4)

5 其他操作以及涉及到的方法

5.1 dict.fromkeys

 
    
     
       
       
         d1 
         = 
         dict 
         .fromkeys([ 
         'host1' 
         , 
         'host2' 
         , 
         'host3' 
         ], 
         'Mac' 
         ) 
        
 
         print 
         (d1) 
        

            
        
 
         d1[ 
         'host1' 
         ] 
         = 
         'xiaomi' 
        
 
         print 
         (d1) 
        
 
         ####### 
        
 
         d2 
         = 
         dict 
         .fromkeys([ 
         'host1' 
         , 
         'host2' 
         , 
         'host3' 
         ],[ 
         'Mac' 
         , 
         'huawei' 
         ]) 
        
 
         print 
         (d2) 
        
 
         d2[ 
         'host1' 
         ][ 
         0 
         ] 
         = 
         'xiaomi' 
        
 
         print 
         (d2) 
        
 
     
 
    
  

5.2 d.copy() 对字典 d 进行浅复制，返回一个和d有相同键值对的新字典

5.3 字典的嵌套

View Code

5.4 sorted(dict) : 返回一个有序的包含字典所有key的列表

5.5 字典的遍历　　

 
         dic5 
         = 
         { 
         'name' 
         :  
         'alex' 
         ,  
         'age' 
         :  
         18 
         } 
        
         for  
         i  
         in  
         dic5: 
        
         print 
         (i,dic5[i]) 
        
         for  
         items  
         in  
         dic5.items(): 
        
         print 
         (items) 
        
         for  
         keys,values  
         in  
         dic5.items(): 
        
         print 
         (keys,values)

还用我们上面的例子，存取这个班学生的信息，我们如果通过字典来完成，那：

八集合(set)

集合是一个无序的，不重复的数据组合，它的主要作用如下：

去重，把一个列表变成集合，就自动去重了
关系测试，测试两组数据之前的交集、差集、并集等关系

集合(set)：把不同的元素组成一起形成集合，是python基本的数据类型。

集合元素(set elements):组成集合的成员(不可重复)

 
    
     
       
       
         li 
         = 
         [ 
         1 
         , 
         2 
         , 
         'a' 
         , 
         'b' 
         ] 
        
 
         s  
         = 
         set 
         (li) 
        
 
         print 
         (s)     
         # {1, 2, 'a', 'b'} 
        

            
        
 
         li2 
         = 
         [ 
         1 
         , 
         2 
         , 
         1 
         , 
         'a' 
         , 
         'a' 
         ] 
        
 
         s 
         = 
         set 
         (li2) 
        
 
         print 
         (s)   
         #{1, 2, 'a'} 
        
 
     
 
    
  

集合对象是一组无序排列的可哈希的值：集合成员可以做字典的键　

 
         li 
         = 
         [[ 
         1 
         , 
         2 
         ], 
         'a' 
         , 
         'b' 
         ] 
        
         s  
         = 
         set 
         (li)  
         #TypeError: unhashable type: 'list' 
        
         print 
         (s)

集合分类：可变集合、不可变集合

可变集合(set)：可添加和删除元素，非可哈希的，不能用作字典的键，也不能做其他集合的元素

不可变集合(frozenset)：与上面恰恰相反

 
         li 
         = 
         [ 
         1 
         , 
         'a' 
         , 
         'b' 
         ] 
        
         s  
         = 
         set 
         (li) 
        
         dic 
         = 
         {s: 
         '123' 
         }  
         #TypeError: unhashable type: 'set'

集合的相关操作　　

1、创建集合

由于集合没有自己的语法格式，只能通过集合的工厂方法set()和frozenset()创建

 
         s1  
         =  
         set 
         ( 
         'alvin' 
         ) 
        
         s2 
         =  
         frozenset 
         ( 
         'yuan' 
         ) 
        
         print 
         (s1, 
         type 
         (s1))   
         #{'l', 'v', 'i', 'a', 'n'} <class 'set'> 
        
         print 
         (s2, 
         type 
         (s2))   
         #frozenset({'n', 'y', 'a', 'u'}) <class 'frozenset'>

2、访问集合

由于集合本身是无序的，所以不能为集合创建索引或切片操作，只能循环遍历或使用in、not in来访问或判断集合元素。

 
         s1  
         =  
         set 
         ( 
         'alvin' 
         ) 
        
         print 
         ( 
         'a'  
         in  
         s1) 
        
         print 
         ( 
         'b'  
         in  
         s1) 
        
         #s1[1]  #TypeError: 'set' object does not support indexing 
        
         for  
         i  
         in  
         s1: 
        
         print 
         (i) 
        
         #     
        
         # True 
        
         # False 
        
         # v 
        
         # n 
        
         # l 
        
         # i 
        
         # a

3、更新集合

可使用以下内建方法来更新：

s.add()
s.update()
s.remove()

注意只有可变集合才能更新：

 
         # s1 = frozenset('alvin') 
        
         # s1.add(0)  #AttributeError: 'frozenset' object has no attribute 'add' 
        
         s2 
         = 
         set 
         ( 
         'alvin' 
         ) 
        
         s2.add( 
         'mm' 
         ) 
        
         print 
         (s2)   
         #{'mm', 'l', 'n', 'a', 'i', 'v'} 
        
         s2.update( 
         'HO' 
         ) 
         #添加多个元素 
        
         print 
         (s2)   
         #{'mm', 'l', 'n', 'a', 'i', 'H', 'O', 'v'} 
        
         s2.remove( 
         'l' 
         ) 
        
         print 
         (s2)   
         #{'mm', 'n', 'a', 'i', 'H', 'O', 'v'}

del：删除集合本身　

四、集合类型操作符　

1 in ,not in
2 集合等价与不等价(==, !=)
3 子集、超集

 
         s 
         = 
         set 
         ( 
         'alvinyuan' 
         ) 
        
         s1 
         = 
         set 
         ( 
         'alvin' 
         ) 
        
         print 
         ( 
         'v'  
         in  
         s) 
        
         print 
         (s1<s)

4 联合(|)

联合(union)操作与集合的or操作其实等价的，联合符号有个等价的方法，union()。

 
         s1 
         = 
         set 
         ( 
         'alvin' 
         ) 
        
         s2 
         = 
         set 
         ( 
         'yuan' 
         ) 
        
         s3 
         = 
         s1|s2 
        
         print 
         (s3)   
         #{'a', 'l', 'i', 'n', 'y', 'v', 'u'} 
        
         print 
         (s1.union(s2))  
         #{'a', 'l', 'i', 'n', 'y', 'v', 'u'}

5、交集(&)

与集合and等价，交集符号的等价方法是intersection()

 
         s1 
         = 
         set 
         ( 
         'alvin' 
         ) 
        
         s2 
         = 
         set 
         ( 
         'yuan' 
         ) 
        
         s3 
         = 
         s1&s2 
        
         print 
         (s3)   
         #{'n', 'a'} 
        
         print 
         (s1.intersection(s2))  
         #{'n', 'a'}

　　6、查集(-)
等价方法是difference()

 
         s1 
         = 
         set 
         ( 
         'alvin' 
         ) 
        
         s2 
         = 
         set 
         ( 
         'yuan' 
         ) 
        
         s3 
         = 
         s1 
         - 
         s2 
        
         print 
         (s3)   
         #{'v', 'i', 'l'} 
        
         print 
         (s1.difference(s2))  
         #{'v', 'i', 'l'}

7、对称差集(^)

对称差分是集合的XOR(‘异或’)，取得的元素属于s1,s2但不同时属于s1和s2.其等价方法symmetric_difference()

 
         s1 
         = 
         set 
         ( 
         'alvin' 
         ) 
        
         s2 
         = 
         set 
         ( 
         'yuan' 
         ) 
        
         s3 
         = 
         s1^s2 
        
         print 
         (s3)   
         #{'l', 'v', 'y', 'u', 'i'} 
        
         print 
         (s1.symmetric_difference(s2))  
         #{'l', 'v', 'y', 'u', 'i'}

应用

 
    
     
       
       
         '''最简单的去重方式''' 
        
 
         lis  
         =  
         [ 
         1 
         , 
         2 
         , 
         3 
         , 
         4 
         , 
         1 
         , 
         2 
         , 
         3 
         , 
         4 
         ] 
        
 
         print  
         list 
         ( 
         set 
         (lis))     
         #[1, 2, 3, 4] 
        
 
     
 
    
  

九文件操作

9.1 对文件操作流程

打开文件，得到文件句柄并赋值给一个变量
通过句柄对文件进行操作
关闭文件

现有文件如下：

 
         昨夜寒蛩不住鸣。 
        
         惊回千里梦，已三更。 
        
         起来独自绕阶行。 
        
         人悄悄，帘外月胧明。 
        
         白首为功名，旧山松竹老，阻归程。 
        
         欲将心事付瑶琴。 
        
         知音少，弦断有谁听。

 
         f  
         =  
         open 
         ( 
         '小重山' 
         )  
         #打开文件 
        
         data 
         = 
         f.read() 
         #获取文件内容 
        
         f.close()  
         #关闭文件

注意 if in the win，hello文件是utf8保存的，打开文件时open函数是通过操作系统打开的文件，而win操作系统

默认的是gbk编码，所以直接打开会乱码，需要f=open('hello',encoding='utf8')，hello文件如果是gbk保存的，则直接打开即可。

9.2 文件打开模式　　

 
    
     
       
       
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         =  
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
        
 
              
         Character Meaning 
        
 
              
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         -  
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
         - 
        
 
              
         'r'        
         open  
         for  
         reading (default) 
        
 
              
         'w'        
         open  
         for  
         writing, truncating the  
         file  
         first 
        
 
              
         'x'        
         create a new  
         file  
         and  
         open  
         it  
         for  
         writing 
        
 
              
         'a'        
         open  
         for  
         writing, appending to the end of the  
         file  
         if  
         it exists 
        
 
              
         'b'        
         binary mode 
        
 
              
         't'        
         text mode (default) 
        
 
              
         '+'        
         open  
         a disk  
         file  
         for  
         updating (reading  
         and  
         writing) 
        
 
              
         'U'        
         universal newline mode (deprecated) 
        
 
              
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         =  
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
         = 
        
 
     
 
    
  

先介绍三种最基本的模式：

 
         # f = open('小重山2','w') #打开文件 
        
         # f = open('小重山2','a') #打开文件 
        
         # f.write('莫等闲1\n') 
        
         # f.write('白了少年头2\n') 
        
         # f.write('空悲切!3')

9.3 文件具体操作

操作方法介绍

 
         f  
         =  
         open 
         ( 
         '小重山' 
         )  
         #打开文件 
        
         # data1=f.read()#获取文件内容 
        
         # data2=f.read()#获取文件内容 
        
         # 
        
         # print(data1) 
        
         # print('...',data2) 
        
         # data=f.read(5)#获取文件内容 
        
         # data=f.readline() 
        
         # data=f.readline() 
        
         # print(f.__iter__().__next__()) 
        
         # for i in range(5): 
        
         #     print(f.readline()) 
        
         # data=f.readlines() 
        
         # for line in f.readlines(): 
        
         #     print(line) 
        
         # 问题来了:打印所有行,另外第3行后面加上:'end 3' 
        
         # for index,line in enumerate(f.readlines()): 
        
         #     if index==2: 
        
         #         line=''.join([line.strip(),'end 3']) 
        
         #     print(line.strip()) 
        
         #切记:以后我们一定都用下面这种 
        
         # count=0 
        
         # for line in f: 
        
         #     if count==3: 
        
         #         line=''.join([line.strip(),'end 3']) 
        
         #     print(line.strip()) 
        
         #     count+=1 
        
         # print(f.tell()) 
        
         # print(f.readline()) 
        
         # print(f.tell())#tell对于英文字符就是占一个,中文字符占三个,区分与read()的不同. 
        
         # print(f.read(5))#一个中文占三个字符 
        
         # print(f.tell()) 
        
         # f.seek(0) 
        
         # print(f.read(6))#read后不管是中文字符还是英文字符,都统一算一个单位,read(6),此刻就读了6个中文字符 
        
         #terminal上操作: 
        
         f  
         =  
         open 
         ( 
         '小重山2' 
         , 
         'w' 
         ) 
        
         # f.write('hello \n') 
        
         # f.flush() 
        
         # f.write('world') 
        
         # 应用:进度条 
        
         # import time,sys 
        
         # for i in range(30): 
        
         #     sys.stdout.write("*") 
        
         #     # sys.stdout.flush() 
        
         #     time.sleep(0.1) 
        
         # f = open('小重山2','w') 
        
         # f.truncate()#全部截断 
        
         # f.truncate(5)#全部截断 
        
         # print(f.isatty()) 
        
         # print(f.seekable()) 
        
         # print(f.readable()) 
        
         f.close()  
         #关闭文件

接下来我们继续扩展文件模式：

 
         # f = open('小重山2','w') #打开文件 
        
         # f = open('小重山2','a') #打开文件 
        
         # f.write('莫等闲1\n') 
        
         # f.write('白了少年头2\n') 
        
         # f.write('空悲切!3') 
        
         # f.close() 
        
         #r+,w+模式 
        
         # f = open('小重山2','r+') #以读写模式打开文件 
        
         # print(f.read(5))#可读 
        
         # f.write('hello') 
        
         # print('------') 
        
         # print(f.read()) 
        
         # f = open('小重山2','w+') #以写读模式打开文件 
        
         # print(f.read(5))#什么都没有,因为先格式化了文本 
        
         # f.write('hello alex') 
        
         # print(f.read())#还是read不到 
        
         # f.seek(0) 
        
         # print(f.read()) 
        
         #w+与a+的区别在于是否在开始覆盖整个文件 
        
         # ok,重点来了,我要给文本第三行后面加一行内容:'hello 岳飞!' 
        
         # 有同学说,前面不是做过修改了吗? 大哥,刚才是修改内容后print,现在是对文件进行修改!!! 
        
         # f = open('小重山2','r+') #以写读模式打开文件 
        
         # f.readline() 
        
         # f.readline() 
        
         # f.readline() 
        
         # print(f.tell()) 
        
         # f.write('hello 岳飞') 
        
         # f.close() 
        
         # 和想的不一样,不管事!那涉及到文件修改怎么办呢? 
        
         # f_read = open('小重山','r') #以写读模式打开文件 
        
         # f_write = open('小重山_back','w') #以写读模式打开文件 
        
         # count=0 
        
         # for line in f_read: 
        
         # if count==3: 
        
         #     f_write.write('hello,岳飞\n') 
        
         # 
        
         # else: 
        
         #     f_write.write(line) 
        
         # another way: 
        
         # if count==3: 
        
         # 
        
         #     line='hello,岳飞2\n' 
        
         # f_write.write(line) 
        
         # count+=1 
        
         # #二进制模式 
        
         # f = open('小重山2','wb') #以二进制的形式读文件 
        
         # # f = open('小重山2','wb') #以二进制的形式写文件 
        
         # f.write('hello alvin!'.encode())#b'hello alvin!'就是一个二进制格式的数据,只是为了观看,没有显示成010101的形式

注意1: 无论是py2还是py3，在r+模式下都可以等量字节替换，但没有任何意义的！　

注意2：有同学在这里会用readlines得到内容列表，再通过索引对相应内容进行修改，最后将列表重新写会该文件。

这种思路有一个很大的问题，数据若很大，你的内存会受不了的，而我们的方式则可以通过迭代器来优化这个过程。　

补充：rb模式以及seek

在py2中：

 
         #昨夜寒蛩不住鸣. 
        
         f  
         =  
         open 
         ( 
         'test' 
         , 
         'r' 
         ,)  
         #以写读模式打开文件 
        
         f.read( 
         3 
         ) 
        
         # f.seek(3) 
        
         # print f.read(3) # 夜 
        
         # f.seek(3,1) 
        
         # print f.read(3) # 寒 
        
         # f.seek(-4,2) 
        
         # print f.read(3) # 鸣

在py3中：

# test: 
昨夜寒蛩不住鸣.

f = open('test','rb',) #以写读模式打开文件

f.read(3)

# f.seek(3)
# print(f.read(3)) # b'\xe5\xa4\x9c'

# f.seek(3,1)
# print(f.read(3)) # b'\xe5\xaf\x92'

# f.seek(-4,2)
# print(f.read(3))   # b'\xe9\xb8\xa3'

#总结: 在py3中,如果你想要字符数据,即用于观看的,则用r模式,这样我f.read到的数据是一个经过decode的
#     unicode数据; 但是如果这个数据我并不需要看,而只是用于传输,比如文件上传,那么我并不需要decode
#     直接传送bytes就好了,所以这个时候用rb模式.

#     在py3中,有一条严格的线区分着bytes和unicode,比如seek的用法,在py2和py3里都是一个个字节的seek,
#     但在py3里你就必须声明好了f的类型是rb,不允许再模糊.

#建议: 以后再读写文件的时候直接用rb模式,需要decode的时候仔显示地去解码.

9.4 with语句

为了避免打开文件后忘记关闭，可以通过管理上下文，即：

 
         with  
         open 
         ( 
         'log' 
         , 
         'r' 
         ) as f: 
        
         pass

如此方式，当with代码块执行完毕时，内部会自动关闭并释放文件资源。

在Python 2.7 后，with又支持同时对多个文件的上下文进行管理，即：

 
         with  
         open 
         ( 
         'log1' 
         ) as obj1,  
         open 
         ( 
         'log2' 
         ) as obj2: 
        
         pass