Fondements mathématiques de l'intelligence artificielle -- Probabilités et statistiques 15 : Variables/vecteurs aléatoires multidimensionnels

1. Définition de la variable aléatoire multidimensionnelle

Généralement, soit X=(X1,X2,···,X,) un vecteur à n dimensions , et chacune de ses composantes, c'est-à-dire que X1,···,Xn est une variable aléatoire unidimensionnelle, alors X est dit vecteur aléatoire à n dimensions ou variable aléatoire à n dimensions .

Comme les variables aléatoires, les vecteurs aléatoires peuvent également être divisés en types discrets et continus.

2. Vecteur aléatoire multidimensionnel discret

Un vecteur aléatoire X=(X1,···,Xn), si chaque composante Xi est une variable aléatoire discrète à une dimension, alors X est dit discret.

2.1 Probabilité de vecteurs aléatoires multidimensionnels discrets

Définition 2.1
Soit ai 1 , ai 2 , ⋅ ⋅ ⋅ pour enregistrer toutes les valeurs possibles de X i ( i = 1 , 2 , ⋅ ⋅ ⋅ ), alors événement X 1 = a 1 j 1 , X 2 = a 2 j 2 , ⋅ ⋅ ⋅ , la probabilité de X n = anjn est appelée un vecteur aléatoire, prenons {a_{i1},a_{i2},···} pour enregistrer toutes les valeurs possibles de X_i (i=1,2 ,···), alors l'événement La probabilité de {X1=a_{1j_1},X2=a_{2j_2},···,Xn=a_{nj_n}} est appelée un vecteur aléatoire,avec unje 1,unje 2,⋅⋅⋅ rappelez-vous XjeToutes les valeurs possibles de i (=1 ,2 ,⋅⋅⋅) , puis événement X 1=un1 j1,X2 _=un2 j2,⋅⋅⋅,Xn _=unnj _nLa probabilité de est appelée un vecteur aléatoire,
enregistré comme :
insérez la description de l'image ici
X=(X1,···,Xn) fonction de probabilité ou distribution de probabilité, la fonction de probabilité doit remplir les conditions :
insérez la description de l'image ici

2.2, distribution multinomiale

La distribution multinomiale est la distribution multidimensionnelle discrète la plus importante, que l'on rencontre souvent dans la pratique. Par exemple, lorsqu'une population est divisée en plusieurs catégories selon des attributs, il s'agit d'une distribution multinomiale.

2.2.1 Définition

Supposons que A1, A2,..., An sont des groupes d'événements complets dans une certaine expérience, c'est-à-dire que les événements A1,..., An s'excluent mutuellement et que leur somme est un événement inévitable (événements A1, · ··, Un doit se produire un et un seul). Prendre P1, P2, ···, Pn pour enregistrer la probabilité des événements A1, A2, ···, An respectivement, puis pi≥0, P1+···+pn=1.
Maintenant l'expérience est répétée N fois indépendamment, et Xi enregistre le nombre d'occurrences de l'événement Ai dans ces N expériences (i=1,...,n), alors X=(X1,...,Xn) est un n vecteur aléatoire dimensionnel. Sa plage de valeurs est : X1, ..., Xn sont tous des entiers non négatifs et leur somme est N. La distribution de probabilité de X est appelée distribution multinomiale , parfois notée M(N; P1,...,Pn) .

2.2.2 Méthode de calcul

Pour déterminer cette distribution, pour calculer la probabilité de l'événement B=(X1=k1,···,Xi=Ki,···,Xn=Kn}, il suffit de considérer que Ki est un entier non négatif et que K1+· ··+Kn =N, sinon P(B)=0.

Pour calculer P(B), partons des résultats bruts j1,j2,···,jN de N essais, qui représentent l'occurrence du premier événement d'essai Aj1, l'occurrence du deuxième essai Aj2, et ainsi de suite. Pour que l'événement B se produise, il doit y avoir k1 de 1, k2 de 2 dans j1, j2,..., jN, etc. Le nombre de telles séquences est égal à la division de N objets différents en n piles, et chaque pile a à son tour k1, k2, ..., kn pièces de différentes divisions. Il existe N!/(k1!···kn!) types de divisions. Deuxièmement, en raison de l'indépendance, en utilisant le théorème de multiplication de probabilité, la probabilité d'occurrence de chaque séquence de résultats d'origine j1j2···jn qui remplit les conditions ci-dessus devrait être p 1 k 1 p 2 k 2 ⋅ ⋅ ⋅ pnkn p_1^{ k1} p_2 ^{ k2}···p_n^{kn}p1k 1p2k2 _⋅⋅⋅pnsavoir. Alors nous obtenons :
insérez la description de l'image ici
la formule ci-dessus est la fonction de probabilité de distribution multinomiale, et son nom est expansion multinomiale :
insérez la description de l'image ici
Σ ∗ signifie que la plage de sommation est : ki est un entier non négatif, k 1 + ⋅ ⋅ ⋅ + kn = N Σ ^* Indique que la plage de sommation est : k_i est un entier non négatif, k1+···+kn=NS indique que la plage de sommation est :kjeest un entier non négatif, k 1 + ⋅⋅⋅+ kn=N. _
Dans la formule ci-dessus, soit xi=pi, et utilise p1+···+pn=1, on obtient :
insérez la description de l'image ici

3. Variable aléatoire multidimensionnelle continue

3.1 Définition

Supposons que X=(X1,···,Xn) est un vecteur aléatoire à n dimensions, et sa valeur peut être considérée comme un espace euclidien à n dimensions R n R^ nRUn point dans n , si toutes les valeurs de X peuvent remplir R n R^nRUne région de n est appelée unevariable aléatoire multidimensionnelle.

Comme une variable continue unidimensionnelle, la manière la plus pratique de décrire la distribution de probabilité d'un vecteur aléatoire multidimensionnel consiste à utiliser une fonction de densité de probabilité. Pour cela, on introduit une notation : X∈A, lire "X appartient à A" ou "X appartient à A", où A est R n R^nRL'ensemble dans n : {XE∈A} est un événement aléatoire, car après avoir fait l'expérience, la valeur de X est connue, donc on peut aussi savoir si elle tombe dans A.

3.2 Fonctions de densité de probabilité des variables aléatoires multidimensionnelles

Définition Si f(x1,···,xn) est défini dans R n R^nRfonction positive sur n , pour R n R^nRPour tout ensemble A dans n

, il y a : Alors on dit que f est la fonction de densité (de probabilité) de X.
Si A est pris comme l'espace completR n R^nRn , alors {X∈A} est un événement inévitable avec une probabilité de 1. Il devrait donc y avoir
insérez la description de l'image ici
C'est aussi une condition que la fonction de densité de probabilité doit satisfaire.

3.3 Distribution uniforme

Vecteur aléatoire bidimensionnel X=(X1,X2), sa fonction de densité de probabilité est :
insérez la description de l'image ici
Alors f est non négatif et satisfait la formule (2.6).

Le graphique correspondant à cette fonction est le suivant :

insérez la description de l'image ici
Toutes les probabilités sont uniformément réparties dans le rectangle correspondant, c'est-à-dire que P(X∈A) est proportionnel à l'aire de A, donc la distribution de X est appelée la distribution uniforme sur le rectangle de la figure .

3.6 Distribution normale bidimensionnelle

La distribution continue multidimensionnelle la plus importante est la distribution normale multidimensionnelle. La fonction de densité de probabilité de la distribution normale bidimensionnelle
insérez la description de l'image ici
dans le cas bidimensionnel est la suivante : ici, par commodité, le symbole exp est introduit et sa signification est : exp (c) = ece^cec . La fonction de densité de probabilité ci-dessus contient 5 constantes a, b,σ 1 2 , σ 2 2 σ_1^2, σ_2^2p12p22, ρ, ce sont les paramètres de la distribution normale bidimensionnelle, et leurs plages de valeurs possibles sont :
a, b∈(-∞, +∞), σ 1 > 0 , σ 2 > 0 σ_1>0, σ_2>0p1>0 , p2>0,ρ∈(-1,1)

La distribution normale bidimensionnelle est souvent enregistrée sous la forme N(a, b, σ 1 2 , σ 2 2 σ_1^2, σ_2^2p12p22, ρ) , son graphe de fonctions dans l'espace tridimensionnel est comme une cloche à section elliptique renversée sur le plan Ox1x2, et son centre est au point (a, b).

peut prouver N(a,b,σ 1 2 、 σ 2 ​​​​2 σ_1^2、σ_2^2p12p22, **ρ)** satisfait aux exigences de la formule (2.6), il s'agit donc d'une fonction de densité de probabilité.

3.7 Points à noter sur les variables aléatoires continues

  1. Qu'il s'agisse d'une variable aléatoire continue unidimensionnelle ou multidimensionnelle, l'essence de la définition est qu'il doit y avoir une fonction de densité de probabilité (car unidimensionnel est une variable) qui satisfait la formule (2.6);
  2. Il n'est pas nécessaire que la fonction de densité de probabilité soit continue dans un intervalle ou une zone ;
  3. Chaque composante d'un vecteur aléatoire continu est une variable aléatoire, mais ce n'est pas nécessairement un vecteur aléatoire si chaque composante est une variable aléatoire ;
  4. La fonction de distribution de probabilité peut être utilisée pour décrire la distribution de probabilité de vecteurs aléatoires multidimensionnels, qui est définie comme : F(x1,x2,…,xn)=P(X1<x1,X2<x2,…,Xn<xn), mais dans le cas de Next multidimensionnel, la fonction de distribution est rarement utilisée.

3.8 Distribution marginale

Soit X=(X1,...,Xn) un vecteur aléatoire à n dimensions, X a une certaine distribution F, qui est une distribution à n dimensions, car chaque composante Xi de X est une variable aléatoire à une dimension, donc ils ont leur propre La distribution Fi(i=1,···,n), ce sont des distributions unidimensionnelles, appelées la distribution marginale distribution marginale . La distribution marginale est entièrement déterminée par la distribution originale F.

3.8.1 Distribution marginale des vecteurs aléatoires discrets

En prenant la première composante comme exemple, la formule de calcul de la densité de probabilité de la distribution marginale des vecteurs aléatoires discrets est :
insérez la description de l'image ici
On peut prouver que pour la distribution multinomiale M(N;p1,...,pn), la marge marginale correspondante est la distribution binomiale B (N,pi).

3.8.2 Distribution marginale des vecteurs aléatoires continus

Supposons que le vecteur aléatoire X=(X1,...,Xn) a une fonction de densité de probabilité f(x1,...,xn), la fonction de densité de probabilité de la distribution marginale de sa composante Xi est de fixer xi, et la n-1 variables restantes de la fonction f Faire une intégrale définie entre -∞ et +∞, comme sous la fonction de densité de x1 :
insérez la description de l'image ici
De cette façon, on peut prouver que la distribution marginale de la distribution normale bidimensionnelle est une distribution normale unidimensionnelle.

4. Résumé

Cet article présente le concept de vecteurs aléatoires multidimensionnels, la définition de leur fonction de densité de probabilité et la définition de la distribution marginale, et donne des exemples de distributions typiques de vecteurs aléatoires multidimensionnels tels que la distribution multinomiale, la distribution uniforme et la distribution normale. Les vecteurs aléatoires multidimensionnels sont également divisés en deux types : discrets et continus. La distribution marginale est une distribution ordinaire, mais une ou plusieurs composantes sont considérées comme des variables, et le reste des composantes sont des distributions obtenues par intégration globale. Par conséquent, la la distribution marginale peut être Elle peut être unidimensionnelle ou multidimensionnelle.
Correspondant à la distribution marginale, le vecteur aléatoire multidimensionnel est aussi appelé distribution conjointe .

La distribution F de tout vecteur aléatoire peut déterminer la distribution marginale Fi de l'une de ses composantes, mais même connaître la distribution marginale Fi de toutes les composantes n'est pas suffisant pour déterminer la distribution F du vecteur aléatoire . Par exemple, si le paramètre ρ de deux distributions normales standard est différent, les deux sont respectivement considérés comme la distribution marginale du vecteur aléatoire bidimensionnel, et les vecteurs aléatoires correspondants sont des distributions différentes. En effet, la distribution marginale ne considère que le cas d'un seul composant et ne considère pas sa relation.

Pour plus de fondements mathématiques de l'intelligence artificielle, veuillez vous référer à la colonne " [Fondements mathématiques de l'intelligence artificielle] One-Dimensional (https://blog.csdn.net/laoyuanpython/category_10382948.html)".

Bloguer n'est pas facile, veuillez soutenir :

Si vous avez gagné quelque chose en lisant cet article, veuillez aimer, commenter et mettre en signet, merci pour votre soutien !

Colonnes payantes sur Old Ape

  1. La colonne payante " https://blog.csdn.net/laoyuanpython/category_9607725.html Utilisation de PyQt pour développer des applications Python d'interface graphique " présente spécifiquement le didacticiel de base du développement d'interface graphique PyQt basé sur Python, et le répertoire d'articles correspondant est " https ://blog.csdn .net/LaoYuanPython/article/details/107580932 Utiliser PyQt pour développer une interface graphique répertoire de colonne d'application Python ";
  2. La colonne payante " https://blog.csdn.net/laoyuanpython/category_10232926.html colonne de développement audio et vidéo moviepy ) présente en détail les méthodes liées aux classes de traitement de synthèse de clips audio et vidéo moviepy et l'utilisation de méthodes associées pour traiter scènes de synthèse de clips associées, articles correspondants .
  3. La colonne payante " https://blog.csdn.net/laoyuanpython/category_10581071.html OpenCV-Python Beginners Difficult Questions Collection " est " https://blog.csdn.net/laoyuanpython/category_9979286.html OpenCV-Python Graphics and Image Traitement " La colonne d'accompagnement est l'intégration de la perception personnelle de l'auteur de certains problèmes rencontrés dans l'apprentissage du graphisme OpenCV-Python et du traitement d'images. Pour comprendre OpenCV, le répertoire d'articles correspondant est " https://blog.csdn.net/LaoYuanPython /article/details/109713407 OpenCV-Python Beginners Difficult Problem Collection Column Directory "
  4. La rubrique payante " https://blog.csdn.net/laoyuanpython/category_10762553.html Introduction to Python Crawlers" présente le contenu du développement de crawler du point de vue d'un novice en développement front-end Internet, y compris les connaissances de base de l'introduction de crawler, et les connaissances de base du développement de crawler.Obtenez des informations sur les articles CSDN, des informations sur les blogueurs, donnez des articles comme, des commentaires et d'autres contenus de combat réels.

Les deux premières colonnes conviennent aux lecteurs novices qui ont une certaine base Python mais aucune connaissance pertinente.La troisième colonne combine s'il vous plaît l'apprentissage " https://blog.csdn.net/laoyuanpython/category_9979286.html OpenCV-Python Graphics and Image Processing " utiliser.

Pour les collègues qui n'ont pas les bases de Python, vous pouvez apprendre Python à partir de zéro via la colonne gratuite de Lao Yuan " https://blog.csdn.net/laoyuanpython/category_9831699.html Column: Python Basic Tutorial Catalog ).

Si vous êtes intéressé et souhaitez soutenir les lecteurs de Laoyuan, vous pouvez acheter des colonnes payantes.

Old Ape Python, apprenez Python avec Old Ape !

☞ ░ Accédez au répertoire des articles de blog Laoyuan Python https://blog.csdn.net/LaoYuanPython

Je suppose que tu aimes

Origine blog.csdn.net/LaoYuanPython/article/details/130795992
conseillé
Classement