Referencia a Python para aprender Python desde cero

1. Introducción a la citación e introducción de herramientas

El procesamiento de variables en Python es muy diferente al lenguaje C. Las variables en Python tienen un atributo especial: identidad, es decir, "identificación de identidad". Esta propiedad especial también se denomina "referencia" en muchos lugares.

Para ilustrar más claramente los problemas relacionados con las referencias, primero presentamos dos herramientas: una función integrada de Python: id(); un operador: is; y sysuna función en un módulo: getrefcount().

1.1 Funciones integradas`id()`

id(object)

Devuelve la “identidad” de un objeto. Este es un número entero que se garantiza que es único y constante para este objeto durante su vida útil. Dos objetos con vidas útiles que no se superponen pueden tener el mismo id()valor.

El valor devuelto es la "identidad" del objeto pasado. El ID es una constante única que corresponde a uno durante la vida útil del objeto pasado. Dos objetos cuya vida útil no se superponen pueden tener el mismo id()valor de retorno.

Detalle de implementación de CPython: esta es la dirección del objeto en la memoria.

Detalle de implementación de CPython: la "identidad" es en realidad la dirección del objeto en la memoria.

- Citado de " Documentación de Python 3.7.4 - Funciones integradas - id() "

En otras palabras, la iddirección de memoria virtual de un objeto se puede tratar como si estuviera implementada en CPython o no.

1.2 Operadores`is`

operación	sentido
es	identidad del objeto

即is的作用是比较对象的标识。

——引自《Python 3.7.4 文档-内置类型》

1.3 `sys`模块函数`getrefcount()`函数

sys.getrefcount(object)

Return the reference count of the object. The count returned is generally one higher than you might expect, because it includes the (temporary) reference as an argument to getrefcount().

返回值是传入对象的引用计数。由于作为参数传入getrefcount()的时候产生了一次临时引用，因此返回的计数值一般要比预期多1。

——引自《Python 3.7.4 文档-sys模块——系统相关参数及函数》

此处的“引用计数”，在 Python 文档中被定义为“对象被引用的次数”。一旦引用计数归零，则对象所在的内存被释放。这是 Python 内部进行自动内存管理的一个机制。

2. 问题示例

C 语言中，变量代表的就是一段固定的内存，而赋给变量的值则是存在这段地址中的数据；但对 Python 来说，变量就不再是一段固定的地址，而只是 Python 中各个对象所附着的标签。理解这一点对于理解 Python 的很多特性十分重要。

2.1 对同一变量赋值

举例来说，对于如下的 C 代码：

int c_variable = 10000;
printf("original address: %p\n", &a); // original address: 0060FEFC
c_variable = 12345;
printf("second address: %p\n", &a); // second address: 0060FEFC
复制代码

对于有 C 语言编程经验的人来说，上述结果是显而易见的：变量c_variable的地址并不会因为赋给它的值有变化而发生变化。对于 C 编译器来说，变量c_variable只是协助它区别各个内存地址的标识，是直接与特定的内存地址绑定的，如图所示：

Asignación de variables en lenguaje C

但 Python 就不一样的。考虑如下代码：

>>> python_variable = 10000
>>> id(python_variable)
1823863879824
>>> python_variable = 12345
>>> id(python_variable)
1823863880176
复制代码

这就有点儿意思了，更加神奇的是，即使赋给变量同一个常数，其得到的id也可能不同：

>>> python_variable = 10000
>>> id(python_variable)
1823863880304
>>> python_variable = 10000
>>> id(python_variable)
1823863879408
复制代码

假如python_variable对应的数据类型是一个列表，那么：

>>> python_variable = [1,2]
>>> id(python_variable)
2161457994952
>>> python_variable = [1,2]
>>> id(python_variable)
2161458037448
复制代码

得到的id值也是不同的。

正如前文所述，在 Python 中，变量就是一块砖，哪里需要哪里搬。每次将一个新的对象赋值给一个变量，都在内存中重新创建了一个对象，这个对象就具有新的引用值。作为一个“标签”，变量也是哪里需要哪里贴，毫无节操可言。

Asignación de variables en Python

但要注意的是，这里还有一个问题：之所以说“即使赋给变量同一个常数，其得到的id也可能不同”，实际上是因为并不是对所有的常数都存在这种情况。以常数1为例，就有如下结果：
>>> littleConst = 1 # 数值较小的整型对象
>>> id(littleConst)
140734357607232
>>> littleConst = 1
>>> id(littleConst)
140734357607232
>>> id(1)
140734357607232
复制代码
可以看到，常数1对应的id一直都是相同的，没有发生变化，因此变量littleConst的id也就没有变化。

这是因为Python在内存中维护了一个特定数量的常量池，对于一定范围内的数值均不再创建新的对象，而直接在这个常量池中进行分配。实际上在我的机器上使用如下代码可以得到这个常量池的范围是 [0, 256] ，而 256 刚好是一个字节的二进制码可以表示的值的个数。
for constant in range(300):
    if constant is not range(300)[constant]:
        print("常量池最大值为：", (constant - 1))
        break
# 常量池最大值为： 256
复制代码

相应地，对于数值进行加减乘除并将结果赋给原来的变量，都会改变变量对应的引用值：

>>> change_ref = 10000
>>> id(change_ref)
2161457772304
>>> change_ref = change_ref + 1
>>> change_ref
10001
>>> id(change_ref)
2161457772880
复制代码

比较代码块第 3、8行的输出结果，可以看到对数值型变量执行加法并赋值会改变对应变量的引用值。这样的表现应该比较好理解。因为按照 Python 运算符的优先级，change_ref = change_ref + 1实际上就是change_ref = (change_ref + 1)，对变量change_ref对应的数值加1之后得到的是一个新的数值，再将这个新的数值赋给change_ref ，于是change_ref的引用也就随之改变。列表也一样：

>>> list_change_ref = [1,2]
>>> id(list_change_ref)
2161458326920
>>> list_change_ref = list_change_ref + [4]
>>> list_change_ref
[1, 2, 4]
>>> id(list_change_ref)
2161458342792
复制代码

2.2 不变的情况

与数值不同，Python 中对列表对象的操作还表现出另一种特性。考虑下面的代码：

>>> list_nonchange = [1, 2, 3]
>>> id(list_nonchange)
2161458355400
>>> list_nonchange[2] = 5
>>> list_nonchange
[1, 2, 5]
>>> id(list_nonchange)
2161458355400
>>> list_nonchange.append(3)
>>> list_nonchange
[1, 2, 5, 3]
>>> id(list_nonchange)
2161458355400
复制代码

观察代码块第 3、8、13三行，输出相同。也就是说，对于列表而言，可以通过直接操作变量本身，从而在不改变其引用的情况下改变所引用的值。

更进一步地，如果是两个变量同时引用同一个列表，则对其中一个变量本身直接进行操作，也会影响到另一个变量的值：

>>> list_example = [1, 2, 3]
>>> list_same_ref = list_example
>>> id(list_example)
1823864610120
>>> id(list_same_ref)
1823864610120
复制代码

显然此时的变量list_example和list_same_ref的id是一致的。现在改变list_example所引用的列表值：

>>> list_example[2] = 5
>>> list_same_ref
[1, 2, 5]
复制代码

可以看到list_same_ref所引用的列表值也随之变化了。再看看相应地id：

>>> id(list_example)
1823864610120
>>> id(list_same_ref)
1823864610120
复制代码

两个变量的id都没有发生变化。再调用append()方法：

>>> list_example.append(3)
>>> list_example
[1, 2, 5, 3]
>>> list_same_ref
[1, 2, 5, 3]
>>> id(list_example)
1823864610120
>>> id(list_same_ref)
1823864610120
复制代码

删除元素：

>>> del list_example[3]
>>> list_example
[1, 2, 5]
>>> list_same_ref
[1, 2, 5]
>>> id(list_example)
1823864610120
>>> id(list_same_ref)
1823864610120
复制代码

在上述所有对列表的操作中，均没有改变相应元素的引用。

也就是说，对于变量本身进行的操作并不会创建新的对象，而是会直接改变原有对象的值。

2.3 一个特殊的地方

本小节示例灵感来自[关于Python中的引用]

数值数据和列表还存在一个特殊的差异。考虑如下代码：

>>> num = 10000
>>> id(num)
2161457772336
>>> num += 1
>>> id(num)
2161457774512
复制代码

有了前面的铺垫，这样的结果很显得很自然。显然在对变量num进行增1操作的时候，还是计算出新值然后进行赋值操作，因此引用发生了变化。

但列表却不然。见如下代码：

>>> li = [1, 2, 3]
>>> id(li)
2161458469960
>>> li += [4]
>>> id(li)
2161458469960
>>> li
[1, 2, 3, 4]
复制代码

注意第 4 行。明明进行的是“相加再赋值”操作，为什么有了跟前面不一样的结果呢？检查变量li的值，发现变量的值也确实发生了改变，但引用却没有变。

实际上这是因为加法运算符在 Python 中存在重载的情况，对列表对象和数值对象来说，加法运算的底层实现是完全不同的，在简单的加法中，列表的运算还是创建了一个新的列表对象；但在简写的加法运算+=实现中，则并没有创建新的列表对象。这一点要十分注意。

3. 原理解析

前面（第3天：Python 变量与数据类型）我们提到过，Python 中的六个标准数据类型实际上分为两大类：可变数据和不可变数据。其中，列表、字典和集合均为“可变对象”；而数字、字符串和元组均为“不可变对象”。实际上上面演示的数值数据（即数字）和列表之间的差异正是这两种不同的数据类型导致的。

由于数字是不可变对象，我们不能够对数值本身进行任何可以改变数据值的操作。因此在 Python 中，每出现一个数值都意味着需要另外分配一个新的内存空间（常量池中的数值例外）。

>>> const_ref = 10000 # 
>>> const_ref == 10000
True
>>> const_ref is 10000
False
>>> id(const_ref)
2161457773424
>>> id(10000)
2161457773136
>>> from sys import getrefcount
>>> getrefcount(const_ref)
2
>>> getrefcount(10000)
3
复制代码

前 9 行的代码容易理解：即使是同样的数值，也可能具有不同的引用值。关键在于这个值是否来自于同一个对象。

而第 12 行的代码则说明除了getrefcount()函数的引用外，变量const_ref所引用的对象就只有1个引用，也就是变量const_ref。一旦变量const_ref被释放，则相应的对象引用计数归零，也会被释放；并且只有此时，这个对象对应的内存空间才是真正的“被释放”。

而作为可变对象，列表的值是可以在不新建对象的情况下进行改变的，因此对列表对象本身直接进行操作，是可以达到“改变变量值而不改变引用”的目的的。

4. 总结

Para "objetos mutables" como listas, diccionarios y conjuntos, al operar en el objeto al que hace referencia la propia variable, solo puede cambiar el valor de la variable sin cambiar la referencia de la variable; pero para "objetos inmutables" como números , cadenas y tuplas ”, porque el objeto en sí no puede realizar operaciones de cambio de valor, por lo que si desea cambiar el valor de la variable correspondiente, debe crear un nuevo objeto y luego asignar el nuevo objeto a la variable.

A través de tal exploración, también podemos comprender más vívidamente el significado profundo de "todo es un objeto". 0

Código de ejemplo: Python-100-Days