Una guía para principiantes sobre la simulación de sistemas dinámicos con Python

Dirección original: Guía para principiantes sobre la simulación de sistemas dinámicos con Python

Autor original: Christian Hubbs

Traducción de: Proyecto de Traducción de Nuggets

Enlace permanente a este artículo: github.com/xitu/gold-m…

Traductores: Johnie Xu , Wang Ning

Correctores: PorridgeZero , DylanXie123

Integración numérica de ecuaciones diferenciales ordinarias de segundo orden usando Python

Imagen de Dan Meyers en Unsplash

Considere tal modelo de péndulo.

Un peso de masa m está suspendido de una cuerda de longitud L y la cuerda se balancea hacia adelante y hacia atrás.

Este es básicamente el sistema más simple que podemos tener en nuestras manos, pero no debemos dejarnos engañar por su aparente simplicidad, ya que crea un interesante sistema dinámico. Usaremos esto como punto de partida para introducir algo de teoría de control básica y contrastarla con el aprendizaje por refuerzo de control continuo. Antes de eso, es necesario tomarse un momento para comprender el modelo de movimiento del péndulo inferior y cómo simular su movimiento.

Resumen

Derivamos un modelo dinámico del sistema de péndulo y creamos dos modelos de simulación utilizando el paquete de conjunto de Python y el método de Euler, respectivamente. Muchas articulaciones y sistemas en los sistemas de control de máquinas se pueden modelar con péndulos simples, por lo que los modelos de simulación aquí pueden servir como base para analizar sistemas complejos.

El texto original es más amigable con la fórmula de visualización del artículo, puede hacer clic aquí para leerlo.

Dinámica del péndulo

Para simular un sistema de péndulo, primero debe comprender la dinámica del péndulo. Primero, dibujamos el diagrama de análisis de fuerza del sistema de péndulo. La longitud de la cuerda del péndulo, la masa de la bola, la gravedad y otras fuerzas que actúan sobre este sistema se muestran en la siguiente figura.

Diagrama de cuerpo libre del péndulo simple.

绘制受力分析图有助于明确所有作用力，确保我们不会有所遗漏。接下来就可以使用牛顿第二运动定律来分析其动力学。牛顿第二运动定律的形式为 F = ma，我们使用其变体——转动定律表达如下：

在这种情况下，τ 是关于原点的扭矩，I 是旋转惯性，α 是角加速度。扭矩由施加在重物上的力的垂直分量 (关于原点的力矩) 给出，旋转惯性即为 I = mL²，角加速度是 θ 的二阶导数。我们可以将这些值代入到上面的牛顿第二定律，可以得到：

为了完整性，我们还可以考虑单摆上的摩擦，这样就得到：

首先要注意的是，由于方程中存在二阶导数 (θ)，所以这是一个二阶常微分方程（ODE）。我们希望能将其简化为一阶系统以便对其进行积分和模拟。但这是以复杂度为代价的，因为我们要把单个二阶系统分解成两个一阶方程。在我们现在分析的这种情况下，复杂度的成本并不大，但是对于更复杂的模型，这样处理可能会适得其反。

为此，我们需要引入两个新变量，分别命名为 θ_1 和 θ_2，并将它们定义为：

我们定义 θ˙_2=θ¨ 来简化上述等式

于是可以得出：

上面的方程式已经准备好了，下面将通过编码来对其进行建模。

模拟单摆动力学

首先导入相关库。

import numpy as np
from scipy import integrate
import matplotlib.pyplot as plt
复制代码

需要先定义一些常量，让质量和长度分别为 1kg 和 1m，至少现在，我们会暂且忽略摩擦，假设 b=0 。我们将模拟单摆从 π/2 (向右升高90度) 的位置开始摆动，并在没有初始速度的情况下释放。我们可以用 0.02s 作为间隔（Δt）来离散化 10s 的时间段。

# 定义常量
m = 1 # 质量 (kg)
L = 1 # 长度 (m)
b = 0 # 摩擦因素 (kg/m^2-s)
g = 9.81 # 重力加速度 (m/s^2)
delta_t = 0.02 # 时间间隔 (s)
t_max = 10 # 最大模拟时长 (s)
theta1_0 = np.pi/2 # 初始角度 (rad)
theta2_0 = 0 #  初始角加速度 (rad/s)
theta_init = (theta1_0, theta2_0)
# 时间序列
t = np.linspace(0, t_max, t_max/delta_t)
复制代码

我们将演示两种模拟方法，首先使用 scipy 库进行数值积分，然后再使用欧拉方法。

Scipy 数值积分

使用 scipy 进行数值积分方法，我们需要为模型构建一个积分函数，称为 int_pendulum_sim。该模型将采用 θ_1 和 θ_2 的初始值 (代码中记为 theta_init) 对时间间隔（Δt）进行积分，然后返回对应的 theta 值。这个函数正好就是我们上面推导出的 θ˙_1 和 θ˙_2 的两个方程。

def int_pendulum_sim(theta_init, t, L=1, m=1, b=0, g=9.81):
    theta_dot_1 = theta_init[1]
    theta_dot_2 = -b/m*theta_init[1] - g/L*np.sin(theta_init[0])
    return theta_dot_1, theta_dot_2
复制代码

我们可以通过上述将函数作为参数传递给 scipy.integrate.odeint 来对我们的系统进行模拟。并且，还需要给出初始值和模拟时长。

theta_vals_int = integrate.odeint(int_pendulum_sim, theta_init, t)
复制代码

函数 odeint 将传入的参数与 θ˙ 进行积分运算，计算结果又作为初始值传入该函数自身以进行下一个时间间隔（Δt）的迭代运算，如此迭代直至所有时间间隔集合被遍历完成。

θ 和 θ˙ 随时间变化可以绘制成如下图。

我们的模型中是没有考虑摩擦力或其他力的，所以单摆只会在 -π/2 和 π/2 之间往复地来回摆动。如果增加初始速度，比如：10 rad/s，会看到单摆的运动位置会随着往复来回摆动不断增加。

半隐式欧拉法

通过数值积分来分析这类模型比较简单，但是积分计算的成本相对较大，尤其是处理较大的模型。如果我们想看到模型的长期动态图，我们可以使用欧拉法代替数值积分法来进行模拟。欧拉法也是在 OpenAI 中解决像 Card-Pole 这类控制问题的方法，它能解决强化学习（RL）中的控制问题。

首先需要得到上述常微分方程的泰勒级数展开式。这种计算方法是一种近似法，因此展开式项越多得出的结果也越准确。考虑到当我们当前的场景，只需要扩展到一阶导数并截去高阶项。

首先，需要注意的是我们需要一个关于 θ(t) 的函数。如果我们将 θ(t) 和 t-t_0 代入到泰勒级数展开式（TSE）中，将得到：

其中 O(t²) 表示我们的高阶项，可以在不失去太多准确度的情况下将其删除。请注意，这仅遵循泰勒展开式（TSE）通用公式。有了这个方程，我们可以参考上面的常微分方程代换式，即：

借此，可以将泰勒展开式与常微分方程关联起来：

这样我们就得到了一种更方便的方法，可以在每个时间间隔中更新模型以获取 θ_1(t) 的最新值。重复 θ˙(t) 的展开和替换，可以得到以下结果：

在模拟中遍历的过程中，我们将更新 t_0 作为上一个时间步，并逐步向前移动模型。另外，请注意，这是半隐式欧拉方法 ,这意味着在我们的第二个方程中，我们使用的是最新的 θ_1(t) 而非 θ_1(t_0) 带入到泰勒展开式（TSE）中。我们做出这种微妙的替代是因为，如果没有它，我们的模型将会发散。本质上，我们使用泰勒展开式（TSE）进行的近似计算有一些误差（还记得，前面提到丢弃了那些高阶项）。在这个应用中，这些错误将新能量引入到了的单摆上 —— 这显然违反了热力学第一定律。进行这种替换可以解决所有这些问题。

def euler_pendulum_sim(theta_init, t, L=1, g=9.81):
    theta1 = [theta_init[0]]
    theta2 = [theta_init[1]]
    dt = t[1] - t[0]
    for i, t_ in enumerate(t[:-1]):
        next_theta1 = theta1[-1] + theta2[-1] * dt
        next_theta2 = theta2[-1] - (b/(m*L**2) * theta2[-1] - g/L *
            np.sin(next_theta1)) * dt
        theta1.append(next_theta1)
        theta2.append(next_theta2)
    return np.stack([theta1, theta2]).T
复制代码

接着运行这个新函数：

theta_vals_euler = euler_pendulum_sim(theta_init, t)
复制代码

绘制的图看起来还不错，让我们看下是否和之前方法一的结果相符合。

mse_pos = np.power(
    theta_vals_int[:,0] - theta_vals_euler[:,0], 2).mean()
mse_vel = np.power(
    theta_vals_int[:,1] - theta_vals_euler[:,1], 2).mean()
print("MSE Position:\t{:.4f}".format(mse_pos))
print("MSE Velocity:\t{:.4f}".format(mse_vel))

MSE Position:	0.0009
MSE Velocity:	0.0000
复制代码

不同方法之间的均方误差非常接近，这说明我们得到了一个很好的近似值。

我们使用了两种不同的方法，分别为常微分方程法和欧拉法，其中欧拉法要比常微分方程法 odeint 求解速度快。下面我们来测试并验证一下是否真的速度要快些。

%timeit euler_pendulum_sim(theta_init, t)

2.1 ms ± 82.8 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

%timeit integrate.odeint(int_pendulum_sim, theta_init, t)

5.21 ms ± 45.5 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
复制代码

与常微分方程的数值积分相比，欧拉方法的速度提高了约 2 倍。

通过以上这些，我们学会了如何使用微积分的第一法则建立和模拟动态模型，并将其应用于一个简单的无摩擦单摆系统。

Los sistemas dinámicos como este son muy útiles para comprender las ciencias naturales. Recientemente escribí un artículo usando la misma técnica, mostrando cómo podemos modelar la propagación explosiva de un virus en una población . Las ecuaciones diferenciales ordinarias (EDO) también son adecuadas para el control de retroalimentación y otras aplicaciones relacionadas en robótica e ingeniería, por lo que se deben dominar los principios básicos de integración numérica.

Si encuentra errores en la traducción u otras áreas que deben mejorarse, vaya al Programa de traducción de Nuggets para revisar y hacer relaciones públicas de la traducción, y también puede obtener los puntos de recompensa correspondientes. El enlace permanente a este artículo al comienzo del artículo es el enlace MarkDown a este artículo en GitHub.

Nuggets Translation Project es una comunidad que traduce artículos técnicos de Internet de alta calidad. La fuente de los artículos son los artículos compartidos en inglés sobre Nuggets. El contenido cubre Android , iOS , front-end , back- end , blockchain , productos , diseño , inteligencia artificial y otros campos. Si desea ver más traducciones de alta calidad, continúe prestando atención al plan de traducción oficial de Nuggets. Weibo y la columna de Zhihu .