MathMech: un modelo mental para sistemas matemáticos

Autor: Zen y el arte de la programación informática

1. Introducción

El usuario promedio que realiza aritmética en una computadora no comprende las reglas y los principios de funcionamiento detrás de sistemas matemáticos complejos. Para los estudiantes principiantes, este “punto ciego matemático” suele ser inevitable. Sin embargo, al leer, mirar o escuchar lo que otras personas comparten, dominar algunos conocimientos o habilidades básicos relevantes puede ayudarle a comprender y aplicar estos conocimientos más rápidamente, e incluso profundizar su impresión de lo que ha aprendido.

Esta vez, buscaremos algunos sistemas matemáticos simples pero ampliamente influyentes, e intentaremos explicar sus estructuras lógicas básicas en un lenguaje fácil de entender, mientras damos algunos ejemplos para demostrar su efectividad y confiabilidad. Este artículo no describirá el vocabulario profesional de las matemáticas, sino que solo abordará una introducción básica, definiciones y descripciones conceptuales.

1. Descripción general del sistema

La palabra "sistema" es una palabra importante en informática y campos relacionados, porque define cómo los diversos elementos de una computadora se relacionan entre sí y trabajan juntos para producir diferentes resultados. Según las diferentes clasificaciones de sistemas, podemos dividir los sistemas informáticos en las siguientes categorías:

1. Sistema de dispositivos de entrada/salida (sistema de E/S): se refiere a los dispositivos e interfaces externos del sistema informático, incluidos teclado, mouse, pantalla, impresora, etc. 2. Sistema de memoria principal: se refiere al almacenamiento de instrucciones y datos en la memoria. 3. Sistema de unidad de procesamiento: se refiere al núcleo informático de la computadora, es decir, la parte de la computadora que realiza diversas tareas informáticas. 4. Sistema de dispositivos periféricos: se refiere a periféricos de computadora, como discos, tarjetas de red, etc. 5. Sistema de bus: se refiere a la transmisión de datos entre varios componentes, conectados por el bus.

Para ejecutar diversos programas de aplicación, además de los diversos subsistemas enumerados anteriormente, el sistema informático también requiere sistemas de soporte auxiliares, como sistemas operativos y sistemas de archivos. El sistema operativo es responsable de administrar diversos recursos y dispositivos de hardware, y el sistema de archivos almacena varios archivos, como documentos, imágenes, videos, etc.

Para resumir brevemente, un sistema informático es un dispositivo de alto rendimiento utilizado para calcular, almacenar y difundir información. Incluye dispositivos de entrada/salida, memoria principal, procesadores, periféricos, buses y otros subsistemas. El núcleo es el sistema procesador. El procesador El sistema es el principal responsable de ejecutar varios algoritmos y tareas informáticas, y de comunicarse con otros subsistemas.

2. Modelo de sistema físico

El modelo de sistema físico es un modelo intuitivo y abstracto que se utiliza para presentar varios parámetros del sistema y sus relaciones. Los modelos de sistemas físicos suelen utilizar ecuaciones diferenciales para representar el proceso físico del sistema y su forma generalmente se ajusta a la distribución de Maxwell-Boltzmann.

2.1 modelo de mecánica newtoniana

El modelo de mecánica newtoniana es el primer modelo de sistema físico propuesto, se basa en las leyes de Newton y supone que las tres cantidades físicas básicas de masa, velocidad y aceleración tienen formas de cálculo.

$$\frac{dx}{dt} = v \label{eq1}$$

$$\frac{dv}{dt} = \frac{-Gm_1m_2}{r^2}\theta \label{eq2}$$

$$\frac{d\theta}{dt} = \frac{\omega}{\sqrt{k}}\sin\left(\theta\right)\cos\left(f\right) + f\tan\ izquierda(\phi\right) \label{eq3}$$

Donde $t$ representa el tiempo, $x, v$ representa la posición y la velocidad, $\theta,\omega$ representa el ángulo y la velocidad angular, $m_i$ representa la masa, $G$ representa la constante de gravedad, $r^2=x ^2 +y^2$ representa el cuadrado de la distancia, $f,\phi$ representa la velocidad angular y el ángulo de dirección.

Este modelo supone que la masa, la distancia y el ángulo tienen formas funcionales simples y, por lo tanto, no describe bien los sistemas físicos del mundo real. Sin embargo, debido a su intuición y facilidad de comprensión, ha sido popular durante algún tiempo y se ha convertido en un libro de texto para muchos físicos.

2.2 Máquina de Boltzmann

La máquina de Boltzmann es una versión mejorada del modelo de sistema físico. Utiliza un modelo de espacio de estados para estudiar el comportamiento dinámico del sistema. Está compuesto por electrónica, reactores nucleares, circuitos, brazos robóticos, robots, etc.

Sus variables de estado básicas son posición, velocidad, carga, magnitud y dirección.

$$x_1, x_2, x_3, v_1, v_2, v_3, n_{elec}, m_{\mathrm{core}}, l_{1} \cdots l_{n}$$

Entre ellos, $x_1, x_2, x_3$ representa las coordenadas de posición, $v_1, v_2, v_3$ representa la velocidad, $n_{elec}$ representa el número de electrones, $m_{\mathrm{core}}$ representa el Tamaño del reactor, $l_1 \cdots l_n$ representa la longitud del circuito.

El circuito es el componente central de la máquina de Boltzmann. Consiste en una serie de puertas binarias llamadas puertas CNOT o NOT. La señal de voltaje de entrada se multiplica por una matriz para activar o inhibir ciertas rutas del circuito.

$$U(x_1, x_2, x_3, v_1, v_2, v_3) = e^{-i \sum_{j=1}^nl_j \sigma(x_j)} \cdot U_\mathrm{circuito} \cdot e^{ i \sum_{j=1}^nl_j \sigma(x_j)}$$

Donde $\sigma(x)$ es el operador hamiltoniano, que es una matriz unitaria evolucionada a través de la evolución del tiempo.

Las máquinas Boltzmann pueden simular muchos sistemas físicos del mundo real, como partículas cargadas, semiconductores, materiales de alta temperatura, circuitos, brazos robóticos, etc.

2.3 Modelo de red tensorial

El modelo de red tensorial es otro modelo de sistema físico complejo que utiliza redes tensoriales para describir el estado de sistemas complejos. Las redes tensoriales se componen de nodos y aristas. Los nodos tienen diferentes valores de atributos y las aristas representan tensores.

$$\ket{\psi} = e^{-\beta H} \cdot \ket{\psi_0} \label{eq4}$$

Donde $\beta$ es un parámetro controlador de cadena de bits, $H$ es un término de entropía y $\ket{\Psi_0}$ representa el estado inicial.

Los modelos de redes tensoriales pueden capturar las características interactivas y no lineales del sistema. Sin embargo, todavía tiene muchas limitaciones, como la incapacidad de simular sistemas complejos que involucran múltiples modos.

3. Modelo de sistema de control

El modelo del sistema de control representa la relación entre la entrada y la salida del sistema y se utiliza para describir la estrategia de control del sistema y la respuesta del sistema.

3.1 Filtro de Kalman

El filtro de Kalman es uno de los modelos de sistemas de control más comunes. Su idea básica es utilizar la diferencia entre los valores medidos y los valores predichos para estimar el estado del sistema.

$$x_{k|k-1} = F_k x_{k-1} + B_k u_{k-1} + L_k w_{k-1} \label{eq5}$$

$$P_{k|k-1} = F_k P_{k-1} F^\top_k + Q_k \label{eq6}$$

Donde $x_{k|k-1}$ es la estimación del estado actual del sistema, $F_k$, $B_k$, $L_k$ son la matriz de transición de estado, la entrada de control y el modelo de ruido del sistema, $Q_k$ es la matriz de covarianza del ruido del sistema.

Según el valor medido $z_k$, la estimación del estado $x_{k|k}$ y la matriz de covarianza de error $P_{k|k}$ se pueden actualizar.

$$K_k = P_{k|k-1} H_k (H_k^\top P_{k|k-1} H_k + R_k)^{-1} \label{eq7}$$

$$x_{k|k} = x_{k|k-1} + K_k (z_k - H_k x_{k|k-1}) \label{eq8}$$

$$P_{k|k} = (I - K_k H_k) P_{k|k-1} \label{eq9}$$

Donde $H_k$ es el modelo de medición, $R_k$ es la matriz de covarianza del ruido de medición.

3.2 Microcontrolador lineal

Un microcontrolador lineal es un modelo de sistema de control simple que representa el estado del sistema como una función lineal y deriva una salida basada en la entrada.

$$y_k = C_k x_k + D_k u_k \label{eq10}$$

Donde $y_k$ es la salida del sistema, $u_k$ es la entrada de control del sistema, $x_k$ es el estado del sistema, $C_k$ y $D_k$ son la matriz de transformación lineal y la ganancia de control del sistema. .

Los microcontroladores lineales pueden simular muchos sistemas del mundo real, como motores de CC, hélices de ascensores, plumas, volantes inerciales, motores de CA controlados, etc.

3.3 Controlador de red neuronal recurrente

La red neuronal recurrente (RNN) es un modelo recursivo capaz de capturar y modelar datos de series de tiempo. Aquí, podemos entrenar un RNN para el control. Los parámetros del RNN se actualizan mediante retropropagación y la estructura de la red se optimiza en función de la estimación del estado del sistema, la entrada y salida de control.

El controlador RNN consta de una capa de entrada, una capa oculta y una capa de salida. La capa de entrada recibe el estado del sistema y la capa de salida genera instrucciones de control del sistema.

Por ejemplo, se puede implementar un controlador RNN utilizando una unidad LSTM, que es capaz de capturar dependencias y memoria a largo plazo.

4. Modelo de aprendizaje por refuerzo

Los modelos de aprendizaje por refuerzo son un intento de que una máquina elija automáticamente una acción para maximizar la recompensa. Su idea básica es permitir que las máquinas aprendan mediante pruebas y exploración como lo hacen los humanos, en lugar de depender de objetivos o reglas fijas.

4.1 Búsqueda de árboles de Montecarlo

Monte Carlo Tree Search (MCTS) es un método de aprendizaje por refuerzo que utiliza el método Monte Carlo para buscar árboles de decisión y construir una secuencia de decisión sistemática.

$$s_0 \en S$$

$$a_0 = argmax_a Q(s_0, a; \theta), a \en A(s_0)$$

$$T(s_0, a_0) = s_1 \en S$$

$$r_0 = R(s_0, a_0, s_1)$$

$$Q(s_0, a_0;\theta) \gets r_0 + \gamma max_a' Q(s_1, a'; \theta)$$

Este algoritmo primero selecciona el nodo raíz, luego selecciona la acción óptima para ingresar al siguiente nodo; si se selecciona la acción incorrecta, volverá al nodo anterior; finalmente, cuando se alcance el estado de terminación, volverá al nodo inicial. nodo Y realizar simulaciones para obtener recompensas.

4.2 Método de gradiente de políticas

Policy Gradient es otro método de aprendizaje por refuerzo que utiliza derivadas parciales de parámetros de políticas para optimizar la función de valor de acción.

$$J(\theta) = E[R_t \delta]$$

$$\nabla_{\theta} J(\theta) = \frac{\partial}{\partial \theta}E[\sum_t \delta_t R_t]\bigg| {\theta=\theta^{\star}} = E[A_t G_t], A_t = (\pi_\theta(s_t)|s_t), G_t = \nabla {\theta} \log\pi_\theta(a_t | mierda)$$

El método de gradiente de políticas se basa en el método de iteración de políticas y utiliza un descenso de gradiente estocástico para resolver la actualización óptima de los parámetros de políticas.

5. Modelo bioinformático

Los modelos bioinformáticos se utilizan para estudiar la composición, función y mecanismos moleculares de los organismos vivos.

5.1 modelo de Markov

El modelo de Maslov es uno de los modelos más antiguos en bioinformática. Describe el ciclo de vida de una araña y una pelota y supone que su comportamiento tiene una constante de Mahalanobis, la tasa de absorción de grasa por unidad de tiempo.

5.2 Modelo del sistema reproductivo de la araña

El modelo del sistema reproductivo de las arañas (Spider System Model) es uno de los modelos más nuevos en bioinformática y simula la arquitectura y el proceso de regulación molecular de las arañas.

El modelo consta de cinco partes: el núcleo, el conducto de secreción del quiste, el quiste de secreción del quiste, el ovario y la hendidura del óvulo. El núcleo celular contiene factores de crecimiento y el ciclo celular produce hormonas que se encargan de regular la distribución, la permeabilidad y el metabolismo de las moléculas.

La vesícula es una célula del cuerpo de la araña, tiene diferentes tipos de neuronas y es responsable de regular la absorción de diversas moléculas de señales y de formar la transmisión de señales entre los tejidos.

Los ovarios y las hendiduras de los huevos son estructuras dentro del cuerpo de la araña que ayudan a completar la formación del agujero fetal y proporcionan nuevas semillas para la reproducción.

El modelo del sistema reproductivo de las arañas puede predecir la distribución, el metabolismo y la interacción de moléculas en el proceso de regulación molecular de las arañas, así como los mecanismos de asignación molecular y asignación de recursos.

6. Modelo de sistema de ingeniería

Los modelos de sistemas de ingeniería se centran en cómo establecer o mantener la estabilidad y confiabilidad de sistemas informáticos, redes informáticas, sistemas de comunicación y sistemas de transporte para satisfacer necesidades o características específicas.

6.1 Modelo de centro de datos

El modelo de centro de datos es un tipo de modelo de sistema de ingeniería que estudia la arquitectura, el diseño, el control y el funcionamiento de los centros de datos.

Un centro de datos consta de servidores, dispositivos de almacenamiento, redes, sistemas de energía, equipos de seguridad, etc., y su escala puede ampliarse desde unos pocos servidores hasta millones de dispositivos. El modelo de centro de datos incluye el diseño general, la disposición y el plan de escalado del centro de datos, y también se centra en evaluar la eficiencia, la utilización de recursos y la eficacia de cada componente del sistema.

6.2 Modelo de sistema de transporte

El Modelo de Sistema de Transporte se centra en la gestión y optimización del flujo de pasajeros y la congestión del tráfico por parte del sistema.

El modelo de sistema de transporte incluye el modelo de red de transporte, el modelo de despacho de tráfico, el modelo de servicio de estacionamiento, el modelo de comportamiento de conducción y el índice de evaluación integral.

El modelo de red de transporte representa la estructura de red estática del sistema de transporte y analiza factores como la capacidad de la red, los métodos de conexión y la adaptación de impedancia.

El modelo de despacho de tráfico tiene en cuenta la congestión de vehículos y supone diferencias en las capacidades entre los distintos conductores para ofrecer rutas óptimas.

El modelo de servicio de estacionamiento estudia la distribución, la relación de oferta y demanda, el mecanismo de gestión, los estándares de cobro y otros factores del estacionamiento.

El modelo de comportamiento de conducción estudia factores como los hábitos de conducción del vehículo, las condiciones del tráfico y las influencias ambientales.

El índice de evaluación integral combina todos los modelos anteriores y se utiliza para determinar si el sistema de transporte es razonable, seguro y rentable.