6.is == id（）编码

本节主要内容:
1. is和==的区别
2. 编码的问题
一. is和==的区别
1. id()
通过id()我们可以查看到一个变量量表示的值在内存中的地址

s = 'alex'
print(id(s)) # 4326667072
s = "alex"
print(id(s)) # 4326667072
lst = [1, 2, 4]
print(id(lst)) # 4326685768
lst1 = [1, 2, 4]
print(id(lst1)) # 4326684360
# 我们发现. 字符串串的数据地址是一样的. 而 列列表的数据地址是不不⼀一样的.
tup = (1, 2)
tup1 = (1, 2)
print(id(tup))
print(id(tup1))
print(id("哈哈哈呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵
呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵"*100))
print(id("哈哈哈呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵
呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵"*100))
s1 = "00000000000000000000000000000000000000000哈哈呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵
呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵
呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵
呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵
呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵
呵呵呵呵呵哈哈哈呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵
呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵
呵呵"
s2 = "00000000000000000000000000000000000000000哈哈呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵
呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵
呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵
呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵
呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵
呵呵呵呵呵哈哈哈呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵
呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵
呵呵"
print(id(s1))
print(id(s2))
print(s1 is s2)
a1 =
str("alexalexalex"+"abcdef1111abcdefgabcdef1111abcdefgabcdef1111abcdefgabcd
ef1111abcdefgabcdef1111abcdefgabcdef1111abcdefgabcdef1111abcdefgabcdef1111a
bcdefgabcdef1111abcdefg")
print(id(a1))
a2 =
str("alexalexalex"+"abcdef1111abcdefgabcdef1111abcdefgabcdef1111abcdefgabcd
ef1111abcdefgabcdef1111abcdefgabcdef1111abcdefgabcdef1111abcdefgabcdef1111a
bcdefgabcdef1111abcdefg")
print(id(a2))
s1 = "@1 2 "
s2 = "@1 2 "
print(id(s1))
print(id(s2)) # 结果⼀一致, 但是在终端中是不不⼀一致的. 所以在python中,命令⾏行行代码和py
件中的代码运⾏行行的效果可能是不不⼀一样的

s = 'alex'
print(id(s)) # 4326667072
s = "alex"
print(id(s)) # 4326667072
lst = [1, 2, 4]
print(id(lst)) # 4326685768
lst1 = [1, 2, 4]
print(id(lst1)) # 4326684360
# 我们发现. 字符串串的数据地址是一样的. 而列列表的数据地址是不不一样的.
tup = (1, 2)
tup1 = (1, 2)
print(id(tup))
print(id(tup1))
print(id("哈哈哈呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵
呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵"*100))
print(id("哈哈哈呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵
呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵"*100))
s1 = "00000000000000000000000000000000000000000哈哈呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵
呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵
呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵
呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵
呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵
呵呵呵呵呵哈哈哈呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵
呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵
呵呵"
s2 = "00000000000000000000000000000000000000000哈哈呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵
呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵
呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵
呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵
呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵
呵呵呵呵呵哈哈哈呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵
呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵呵
呵呵"
print(id(s1))
print(id(s2))
print(s1 is s2)
a1 =
str("alexalexalex"+"abcdef1111abcdefgabcdef1111abcdefgabcdef1111abcdefgabcd
ef1111abcdefgabcdef1111abcdefgabcdef1111abcdefgabcdef1111abcdefgabcdef1111a
bcdefgabcdef1111abcdefg")
print(id(a1))
a2 =
str("alexalexalex"+"abcdef1111abcdefgabcdef1111abcdefgabcdef1111abcdefgabcd
ef1111abcdefgabcdef1111abcdefgabcdef1111abcdefgabcdef1111abcdefgabcdef1111a
bcdefgabcdef1111abcdefg")
print(id(a2))
s1 = "@1 2 "
s2 = "@1 2 "
print(id(s1))
print(id(s2)) # 结果一致, 但是在终端中是不不一致的. 所以在python中,命令行行代码和py
件中的代码运行行的效果可能是不不一样的
小数据池(常量量池): 把我们使用过的值存储在⼩小数据池中.供其他的变量量使用.
小数据池给数字和字符串串使用, 其他数据类型不存在.
对于数字: -5~256是会被加到小数据池中的. 每次使用都是同一个对象.
对于字符串串:
1. 如果是纯字信息和下划线. 那么这个对象会被添加到小数据池
2. 如果是带有特殊字符的. 那么不会被添加到小数据池. 每次都是新的
3. 如果是单一字母*n的情况. 'a'*20, 在20个单位内是可以的. 超过20个单位就不会添加
到小数据池中
注意(一般情况下): 在py件中. 如果你只是单纯的定义一个字符串串. 那么一般情况下都是会
被添加到小数据池中的. 我们可以这样认为: 在使用字符串串的时候, python会帮我们把字符串串
进⾏行行缓存, 在下次使用的时候直接指向这个字符串串即可. 可以节省很多内存.
这个问题千万不要纠结. 因为官方没有给出一个完美的结论和定论.所以只能是自己摸索.
以下内容摘自官网中关于id()的描述

Return the “identity” of an object. This is an integer which is
guaranteed to be unique and constant for this object during its
lifetime. Two objects with non-overlapping lifetimes may have the
same id() value.
CCPPyytthhoonn iimmpplleemmeennttaattiioonn ddeettaaiill:: This is the address of the object in
memory.

说了了这么多. 这个id()和is有什什么关系呢. 注意. is⽐比较的就是id()计算出来的结果. 由于id是帮我
们查看某数据(对象) 的内存地址. 那么is⽐比较的就是数据(对象)的内存地址.
最终我们通过is可以查看两个变量量使⽤用的是否是同⼀一个对象.
== 双等表⽰示的是判断是否相等, 注意. 这个双等⽐比较的是具体的值.⽽而不是内存地址

s1 = "哈哈"
s2 = "哈哈"
print(s1 == s2) # True
print(s1 is s2) # True 原因是有⼩小数据池的存在 导致两个变量量指向的是同⼀一个对象
l1 = [1, 2, 3]
l2 = [1, 2, 3]
print(l1 == l2) # True, 值是⼀一样的
print(l1 is l2) # False, 值是假的

总结:
is 比较的是地址
== 比较的是值
二. 编码的补充
1. python2中默认使用的是ASCII码. 所以不支持中. 如果需要在Python2中更更改编码.
需要在件的开始编写:

# -*- encoding:utf-8 -*-

2. python3中: 内存中使用的是unicode码.
编码回顾:
1. ASCII : 最早的编码. 里里面有英大写字母, 小写字母, 数字, 一些特殊字符. 没有中,
8个01代码, 8个bit, 1个byte
2. GBK: 中国标码, 里里面包含了了ASCII编码和中常用编码. 16个bit, 2个byte
3. UNICODE: 万国码, 里里面包含了了全世界所有国家字的编码. 32个bit, 4个byte, 包含了了
ASCII
4. UTF-8: 可变长度的万国码. 是unicode的一种实现. 最小字符占8位
1.英: 8bit 1byte
2.欧洲字:16bit 2byte
3.中:24bit 3byte
综上, 除了了ASCII码以外, 其他信息不能直接转换.
在python3的内存中. 在程序运行行阶段. 使⽤用的是unicode编码. 因为unicode是万国码. 什什么内
容都可以进⾏行行显⽰示. 那么在数据传输和存储的时候由于unicode比较浪费空间和资源. 需要把
unicode转存成UTF-8或者GBK进行行存储. 怎么转换呢. 在python中可以把字信息进行行编码.
编码之后的内容就可以进行行传输了了. 编码之后的数据是bytes类型的数据.其实啊. 还是原来的
数据只是经过编码之后表现形式发生了了改变而已.
bytes的表现形式:
1. 英 b'alex' 英的表现形式和字符串串没什什么两样
2. 中 b'\xe4\xb8\xad' 这是一个汉字的UTF-8的bytes表现形式
字符串串在传输时转化成bytes=> encode(字符集)来完成

s = "alex"
print(s.encode("utf-8")) # 将字符串串编码成UTF-8
print(s.encode("GBK")) # 将字符串串编码成GBK
结果:
b'alex'
b'alex'
s = "中"
print(s.encode("UTF-8")) # 中编码成UTF-8
print(s.encode("GBK")) # 中编码成GBK
结果:
b'\xe4\xb8\xad'
b'\xd6\xd0'

记住: 英编码之后的结果和源字符串一致. 中编码之后的结果根据编码的不同. 编码结果
也不同. 我们能看到. 一个中的UTF-8编码是3个字节. 一个GBK的中编码是2个字节.

猜你喜欢