Fundamentos Matemáticos de la Inteligencia Artificial--Probabilidad y Estadística 15: Variables/Vectores Aleatorios Multidimensionales

1. Definición de variable aleatoria multidimensional

Generalmente, sea X=(X1,X2,···,X,) un vector n-dimensional , y cada uno de sus componentes, es decir, X1,···,Xn es una variable aleatoria unidimensional, entonces X se dice que es un vector aleatorio n dimensional o una variable aleatoria n-dimensional .

Al igual que las variables aleatorias, los vectores aleatorios también se pueden dividir en tipos discretos y continuos.

2. Vector aleatorio multidimensional discreto

Un vector aleatorio X=(X1,···,Xn), si cada componente Xi es una variable aleatoria discreta unidimensional, entonces X se llama discreta.

2.1 Probabilidad de vectores aleatorios multidimensionales discretos

Definición 2.1
Tome ai 1 , ai 2 , ⋅ ⋅ ⋅ para registrar todos los valores posibles de X i ( i = 1 , 2 , ⋅ ⋅ ⋅ ), luego evento X 1 = a 1 j 1 , X 2 = a 2 j 2 , ⋅ ⋅ ⋅ , la probabilidad de X n = anjn se llama vector aleatorio, toma {a_{i1},a_{i2},···} para registrar todos los valores posibles de X_i (i=1,2 ,···), entonces el evento La probabilidad de {X1=a_{1j_1},X2=a_{2j_2},···,Xn=a_{nj_n}} se denomina vector aleatorio,con unyo 1,ayo 2,⋅⋅⋅ recuerda XyoTodos los valores posibles de i (=1 ,2 ,⋅⋅⋅) , luego evento X 1=a1 j1,X2 _=a2 j2,⋅⋅⋅,X norte=an jnLa probabilidad de se denomina vector aleatorio,
se registra como:
inserte la descripción de la imagen aquí
X=(X1,···,Xn) función de probabilidad o distribución de probabilidad, la función de probabilidad debe cumplir las condiciones:
inserte la descripción de la imagen aquí

2.2, distribución multinomial

La distribución multinomial es la distribución multidimensional discreta más importante, que a menudo se encuentra en la práctica.Por ejemplo, cuando una población se divide en varias categorías según los atributos, se trata de una distribución multinomial.

2.2.1 Definición

Sean A1, A2, ..., An un grupo de eventos completo bajo cierto experimento, es decir, los eventos A1, ..., An son mutuamente excluyentes, y su suma es un evento inevitable (eventos A1, · ··, Un debe ocurrir uno y sólo uno). Tome P1, P2, ···, Pn respectivamente para registrar la probabilidad de los eventos A1, A2, ···, An, luego pi≥0, P1+···+pn=1.
Ahora el experimento se repite N veces de forma independiente, y Xi registra el número de ocurrencias del evento Ai en estos N experimentos (i=1,...,n), entonces X=(X1,...,Xn) es un n vector aleatorio dimensional. Su rango de valores es: X1, ..., Xn son todos enteros no negativos, y su suma es N. La distribución de probabilidad de X se llama distribución multinomial , a veces denotada como M(N; P1,...,Pn) .

2.2.2 Método de cálculo

Para determinar esta distribución, para calcular la probabilidad del evento B=(X1=k1,···,Xi=Ki,···,Xn=Kn}, basta con considerar que Ki es un número entero no negativo y K1+· ··+Kn =N, en caso contrario P(B)=0.

Para calcular P(B), comience con los resultados sin procesar j1,j2,···,jN de N pruebas, que representan la ocurrencia del primer evento de prueba Aj1, la ocurrencia de la segunda prueba Aj2, y así sucesivamente. Para que ocurra el evento B, debe haber k1 de 1s, k2 de 2s en j1, j2, . . . , jN, y así sucesivamente. El número de tales secuencias es igual a dividir N objetos diferentes en n pilas, y cada pila tiene k1, k2, ..., kn piezas de diferentes divisiones a su vez. Hay N!/(k1!···kn!) clases de divisiones. En segundo lugar, debido a la independencia, utilizando el teorema de la multiplicación de probabilidades, la probabilidad de ocurrencia de cada secuencia de resultados original j1j2···jn que cumpla con las condiciones anteriores debe ser p 1 k 1 p 2 k 2 ⋅ ⋅ ⋅ pnkn p_1^{ k1} p_2 ^{ k2}···p_n^{kn}pag1k 1pag2k2_ _⋅⋅⋅pagnortekn. Entonces obtenemos:
inserte la descripción de la imagen aquí
la fórmula anterior es la función de probabilidad de distribución multinomial, y su nombre es expansión multinomial:
inserte la descripción de la imagen aquí
Σ ∗ significa que el rango de suma es: ki es un número entero no negativo, k 1 + ⋅ ⋅ ⋅ + kn = N Σ ^* Indica que el rango de suma es: k_i es un número entero no negativo, k1+···+kn=NS indica que el rango de la sumatoria es:kyoes un entero no negativo, k 1 + ⋅⋅⋅+ kn=n._ _
En la fórmula anterior, sea xi=pi y use p1+···+pn=1, obtenga:
inserte la descripción de la imagen aquí

3. Variable aleatoria multidimensional continua

3.1 Definición

Supongamos que X=(X1,···,Xn) es un vector aleatorio n-dimensional, y su valor puede considerarse como un espacio euclidiano n-dimensional R n R^nRUn punto en n , si todos los valores de X pueden llenar R n R^nRUna región en n se denominavariable aleatoria multidimensional.

Como una variable continua unidimensional, la forma más conveniente de describir la distribución de probabilidad de un vector aleatorio multidimensional es usar una función de densidad de probabilidad. Para ello, introducimos una notación: X∈A, léase "X pertenece a A" o "X cae dentro de A", donde A es R n R^nREl conjunto en n : {XE∈A} es un evento aleatorio, ya que después de hacer el experimento se conoce el valor de X, por lo que también se puede saber si cae en A.

3.2 Funciones de densidad de probabilidad de variables aleatorias multidimensionales

Definición Si f(x1,···,xn) está definida en R n R^nRfunción no negativa en n , para R n R^nRPara cualquier conjunto A en n

, existe: Entonces se dice que f es la función de densidad (de probabilidad) de X.
Si A se toma como el espacio completoR n R^nRn , entonces {X∈A} es un evento inevitable con una probabilidad de 1. Entonces debería haber
inserte la descripción de la imagen aquí
Esta es también una condición que la función de densidad de probabilidad debe satisfacer.

3.3 Distribución uniforme

Vector aleatorio bidimensional X=(X1,X2), su función de densidad de probabilidad es:
inserte la descripción de la imagen aquí
Entonces f no es negativa y satisface la fórmula (2.6).

La gráfica correspondiente a esta función es la siguiente:

inserte la descripción de la imagen aquí
Todas las probabilidades están distribuidas uniformemente en el rectángulo correspondiente, es decir, P(X∈A) es proporcional al área de A, por lo que la distribución de X se llama distribución uniforme en el rectángulo de la figura .

3.6 Distribución normal bidimensional

La distribución continua multidimensional más importante es la distribución normal multidimensional.La función de densidad de probabilidad de la distribución normal bidimensional
inserte la descripción de la imagen aquí
en el caso bidimensional es la siguiente: Aquí, por conveniencia, se introduce el símbolo exp, y su significado es: exp (c) = ece^cmido . La función de densidad de probabilidad anterior contiene 5 constantes a, b,σ 1 2 , σ 2 2 σ_1^2, σ_2^2pag12pag _22, ρ, son los parámetros de la distribución normal bidimensional, y sus rangos de valores posibles son:
a, b∈(-∞, +∞), σ 1 > 0 , σ 2 > 0 σ_1>0, σ_2>0pag1>0 pag2>0,ρ∈(-1,1)

La distribución normal bidimensional a menudo se registra como N(a, b, σ 1 2 , σ 2 2 σ_1^2, σ_2^2pag12pag _22, ρ) , su función gráfica en el espacio tridimensional es como una campana de sección elíptica invertida en el plano Ox1x2, y su centro está en el punto (a, b).

puede probar N(a,b,σ 1 2 、 σ 2 ​​​​2 σ_1^2、σ_2^2pag12pag _22, **ρ)** satisface los requisitos de la fórmula (2.6), por lo que esta es una función de densidad de probabilidad.

3.7 Puntos a tener en cuenta sobre las variables aleatorias continuas

  1. Ya sea que se trate de una variable aleatoria continua unidimensional o multidimensional, la esencia de la definición es que debe haber una función de densidad de probabilidad (ya que unidimensional es una variable) que satisfaga la fórmula (2.6);
  2. No se requiere si la función de densidad de probabilidad es continua en un intervalo o área;
  3. Cada componente de un vector aleatorio continuo es una variable aleatoria, pero no es necesariamente un vector aleatorio si cada componente es una variable aleatoria;
  4. La función de distribución de probabilidad se puede utilizar para describir la distribución de probabilidad de vectores aleatorios multidimensionales, que se define como: F(x1,x2,…,xn)=P(X1<x1,X2<x2,…,Xn<xn), pero en el caso de Next multidimensional, la función de distribución rara vez se usa.

3.8 Distribución marginal

Sea X=(X1,...,Xn) un vector aleatorio n-dimensional, X tiene una cierta distribución F, que es una distribución n-dimensional, porque cada componente Xi de X es una variable aleatoria unidimensional, entonces tienen su propia distribución Fi(i=1,···,n), estas son distribuciones unidimensionales, llamadas distribución marginal distribución marginal . La distribución marginal está completamente determinada por la distribución original F.

3.8.1 Distribución marginal de vectores aleatorios discretos

Tomando como ejemplo la primera componente, la fórmula para calcular la densidad de probabilidad de la distribución marginal de vectores aleatorios discretos es:
inserte la descripción de la imagen aquí
Se puede probar que para la distribución multinomial M(N;p1,...,pn), la distribución marginal correspondiente distribución es la distribución binomial B (N,pi).

3.8.2 Distribución marginal de vectores aleatorios continuos

Supongamos que el vector aleatorio X=(X1,...,Xn) tiene una función de densidad de probabilidad f(x1,...,xn), la función de densidad de probabilidad de la distribución marginal de su componente Xi es fijar xi, y el n-1 variables restantes de la función f Haga una integral definida entre -∞ y +∞, como bajo la función de densidad de x1:
inserte la descripción de la imagen aquí
De esta manera, se puede demostrar que la distribución marginal de la distribución normal bidimensional es una distribución normal unidimensional.

Cuatro Resumen

Este documento presenta el concepto de vectores aleatorios multidimensionales, la definición de su función de densidad de probabilidad y la definición de distribución marginal, y brinda ejemplos de distribuciones típicas de vectores aleatorios multidimensionales, como la distribución multinomial, la distribución uniforme y la distribución normal. Los vectores aleatorios multidimensionales también se dividen en dos tipos: discretos y continuos. La distribución marginal es una distribución común, pero uno o más componentes se consideran variables, y el resto de los componentes son distribuciones obtenidas por integración global. Por lo tanto, la distribución marginal puede ser Puede ser unidimensional o multidimensional.
En correspondencia con la distribución marginal, el vector aleatorio multidimensional también se denomina distribución conjunta .

La distribución F de cualquier vector aleatorio puede determinar la distribución marginal Fi de uno de sus componentes, pero aún conocer la distribución marginal Fi de todos los componentes no es suficiente para determinar la distribución F del vector aleatorio . Por ejemplo, si el parámetro ρ de dos distribuciones normales estándar es diferente, las dos se consideran respectivamente como la distribución marginal del vector aleatorio bidimensional y los vectores aleatorios correspondientes son distribuciones diferentes. Esto se debe a que la distribución marginal solo considera el caso de un solo componente y no considera su relación.

Para obtener más fundamentos matemáticos de inteligencia artificial, consulte la columna " [Fundamentos matemáticos de inteligencia artificial] Unidimensional (https://blog.csdn.net/laoyuanpython/category_10382948.html)".

Bloguear no es fácil, por favor apoye:

Si ha ganado algo al leer este artículo, haga clic en Me gusta, comente y marque como favorito, ¡gracias por su apoyo!

Columnas pagadas sobre Old Ape

  1. La columna de pago " https://blog.csdn.net/laoyuanpython/category_9607725.html Uso de PyQt para desarrollar aplicaciones Python de interfaz gráfica" presenta específicamente el tutorial básico del desarrollo de interfaz gráfica PyQt basado en Python, y el directorio del artículo correspondiente es " https ://blog.csdn .net/LaoYuanPython/article/details/107580932 Use PyQt para desarrollar un directorio de columna de aplicación Python de interfaz gráfica ";
  2. La columna de pago " https://blog.csdn.net/laoyuanpython/category_10232926.html columna de desarrollo de audio y video de moviepy ) presenta en detalle los métodos relacionados con la clase del procesamiento de síntesis de clips de audio y video de moviepy y el uso de métodos relacionados para procesar escenas de síntesis de clips relacionadas, artículos correspondientes El directorio es " https://blog.csdn.net/LaoYuanPython/article/details/107574583 directorio de artículos de la columna de desarrollo de audio y video moviepy ";
  3. La columna paga " https://blog.csdn.net/laoyuanpython/category_10581071.html OpenCV-Python Beginners Difficult Questions Collection " es " https://blog.csdn.net/laoyuanpython/category_9979286.html OpenCV-Python Graphics and Image Procesamiento "La columna adjunta es la integración de la percepción personal del autor de algunos problemas encontrados en el aprendizaje de gráficos OpenCV-Python y procesamiento de imágenes. Para comprender OpenCV, el directorio del artículo correspondiente es " https://blog.csdn.net/LaoYuanPython /article/details/109713407 Directorio de columnas de recopilación de problemas difíciles para principiantes de OpenCV-Python "
  4. La columna de pago " https://blog.csdn.net/laoyuanpython/category_10762553.html Getting Started with Python Crawlers" presenta lo que debe saber sobre el desarrollo de rastreadores desde la perspectiva de un novato en el desarrollo front-end de Internet, incluidos los conceptos básicos para obtener Comenzó con los rastreadores y cómo rastrear Obtenga información de artículos de CSDN, información de bloggers, otorgue Me gusta a artículos, comentarios y otro contenido de combate real.

Las primeras dos columnas son adecuadas para lectores novatos que tienen cierta base de Python pero no tienen conocimientos relevantes. La tercera columna combina " https://blog.csdn.net/laoyuanpython/category_9979286.html OpenCV-Python Graphics and Image Processing " aprendizaje usar.

Para los colegas que carecen de la base de Python, pueden aprender Python desde cero a través de la columna gratuita de Lao Yuan " https://blog.csdn.net/laoyuanpython/category_9831699.html Column: Python Basic Tutorial Catalog ".

Si está interesado y dispuesto a apoyar a los lectores de Laoyuan, puede comprar columnas pagas.

Old Ape Python, ¡aprende Python de Old Ape!

☞ ░ Vaya al directorio de publicaciones del blog Laoyuan Python https://blog.csdn.net/LaoYuanPython

Supongo que te gusta

Origin blog.csdn.net/LaoYuanPython/article/details/130795992
Recomendado
Clasificación