1. Définition de la variable aléatoire multidimensionnelle
Généralement, soit X=(X1,X2,···,X,) un vecteur à n dimensions , et chacune de ses composantes, c'est-à-dire que X1,···,Xn est une variable aléatoire unidimensionnelle, alors X est dit vecteur aléatoire à n dimensions ou variable aléatoire à n dimensions .
Comme les variables aléatoires, les vecteurs aléatoires peuvent également être divisés en types discrets et continus.
2. Vecteur aléatoire multidimensionnel discret
Un vecteur aléatoire X=(X1,···,Xn), si chaque composante Xi est une variable aléatoire discrète à une dimension, alors X est dit discret.
2.1 Probabilité de vecteurs aléatoires multidimensionnels discrets
Définition 2.1
Soit ai 1 , ai 2 , ⋅ ⋅ ⋅ pour enregistrer toutes les valeurs possibles de X i ( i = 1 , 2 , ⋅ ⋅ ⋅ ), alors événement X 1 = a 1 j 1 , X 2 = a 2 j 2 , ⋅ ⋅ ⋅ , la probabilité de X n = anjn est appelée un vecteur aléatoire, prenons {a_{i1},a_{i2},···} pour enregistrer toutes les valeurs possibles de X_i (i=1,2 ,···), alors l'événement La probabilité de {X1=a_{1j_1},X2=a_{2j_2},···,Xn=a_{nj_n}} est appelée un vecteur aléatoire,avec unje 1,unje 2,⋅⋅⋅ rappelez-vous XjeToutes les valeurs possibles de i (=1 ,2 ,⋅⋅⋅) , puis événement X 1=un1 j1,X2 _=un2 j2,⋅⋅⋅,Xn _=unnj _nLa probabilité de est appelée un vecteur aléatoire,
enregistré comme :
X=(X1,···,Xn) fonction de probabilité ou distribution de probabilité, la fonction de probabilité doit remplir les conditions :
2.2, distribution multinomiale
La distribution multinomiale est la distribution multidimensionnelle discrète la plus importante, que l'on rencontre souvent dans la pratique. Par exemple, lorsqu'une population est divisée en plusieurs catégories selon des attributs, il s'agit d'une distribution multinomiale.
2.2.1 Définition
Supposons que A1, A2,..., An sont des groupes d'événements complets dans une certaine expérience, c'est-à-dire que les événements A1,..., An s'excluent mutuellement et que leur somme est un événement inévitable (événements A1, · ··, Un doit se produire un et un seul). Prendre P1, P2, ···, Pn pour enregistrer la probabilité des événements A1, A2, ···, An respectivement, puis pi≥0, P1+···+pn=1.
Maintenant l'expérience est répétée N fois indépendamment, et Xi enregistre le nombre d'occurrences de l'événement Ai dans ces N expériences (i=1,...,n), alors X=(X1,...,Xn) est un n vecteur aléatoire dimensionnel. Sa plage de valeurs est : X1, ..., Xn sont tous des entiers non négatifs et leur somme est N. La distribution de probabilité de X est appelée distribution multinomiale , parfois notée M(N; P1,...,Pn) .
2.2.2 Méthode de calcul
Pour déterminer cette distribution, pour calculer la probabilité de l'événement B=(X1=k1,···,Xi=Ki,···,Xn=Kn}, il suffit de considérer que Ki est un entier non négatif et que K1+· ··+Kn =N, sinon P(B)=0.
Pour calculer P(B), partons des résultats bruts j1,j2,···,jN de N essais, qui représentent l'occurrence du premier événement d'essai Aj1, l'occurrence du deuxième essai Aj2, et ainsi de suite. Pour que l'événement B se produise, il doit y avoir k1 de 1, k2 de 2 dans j1, j2,..., jN, etc. Le nombre de telles séquences est égal à la division de N objets différents en n piles, et chaque pile a à son tour k1, k2, ..., kn pièces de différentes divisions. Il existe N!/(k1!···kn!) types de divisions. Deuxièmement, en raison de l'indépendance, en utilisant le théorème de multiplication de probabilité, la probabilité d'occurrence de chaque séquence de résultats d'origine j1j2···jn qui remplit les conditions ci-dessus devrait être p 1 k 1 p 2 k 2 ⋅ ⋅ ⋅ pnkn p_1^{ k1} p_2 ^{ k2}···p_n^{kn}p1k 1p2k2 _⋅⋅⋅pnsavoir. Alors nous obtenons :
la formule ci-dessus est la fonction de probabilité de distribution multinomiale, et son nom est expansion multinomiale :
Σ ∗ signifie que la plage de sommation est : ki est un entier non négatif, k 1 + ⋅ ⋅ ⋅ + kn = N Σ ^* Indique que la plage de sommation est : k_i est un entier non négatif, k1+···+kn=NS∗ indique que la plage de sommation est :kjeest un entier non négatif, k 1 + ⋅⋅⋅+ kn=N. _
Dans la formule ci-dessus, soit xi=pi, et utilise p1+···+pn=1, on obtient :
3. Variable aléatoire multidimensionnelle continue
3.1 Définition
Supposons que X=(X1,···,Xn) est un vecteur aléatoire à n dimensions, et sa valeur peut être considérée comme un espace euclidien à n dimensions R n R^ nRUn point dans n , si toutes les valeurs de X peuvent remplir R n R^nRUne région de n est appelée unevariable aléatoire multidimensionnelle.
Comme une variable continue unidimensionnelle, la manière la plus pratique de décrire la distribution de probabilité d'un vecteur aléatoire multidimensionnel consiste à utiliser une fonction de densité de probabilité. Pour cela, on introduit une notation : X∈A, lire "X appartient à A" ou "X appartient à A", où A est R n R^nRL'ensemble dans n : {XE∈A} est un événement aléatoire, car après avoir fait l'expérience, la valeur de X est connue, donc on peut aussi savoir si elle tombe dans A.
3.2 Fonctions de densité de probabilité des variables aléatoires multidimensionnelles
Définition Si f(x1,···,xn) est défini dans R n R^nRfonction positive sur n , pour R n R^nRPour tout ensemble A dans n
, il y a : Alors on dit que f est la fonction de densité (de probabilité) de X.
Si A est pris comme l'espace completR n R^nRn , alors {X∈A} est un événement inévitable avec une probabilité de 1. Il devrait donc y avoir
C'est aussi une condition que la fonction de densité de probabilité doit satisfaire.
3.3 Distribution uniforme
Vecteur aléatoire bidimensionnel X=(X1,X2), sa fonction de densité de probabilité est :
Alors f est non négatif et satisfait la formule (2.6).
Le graphique correspondant à cette fonction est le suivant :
Toutes les probabilités sont uniformément réparties dans le rectangle correspondant, c'est-à-dire que P(X∈A) est proportionnel à l'aire de A, donc la distribution de X est appelée la distribution uniforme sur le rectangle de la figure .
3.6 Distribution normale bidimensionnelle
La distribution continue multidimensionnelle la plus importante est la distribution normale multidimensionnelle. La fonction de densité de probabilité de la distribution normale bidimensionnelle
dans le cas bidimensionnel est la suivante : ici, par commodité, le symbole exp est introduit et sa signification est : exp (c) = ece^cec . La fonction de densité de probabilité ci-dessus contient 5 constantes a, b,σ 1 2 , σ 2 2 σ_1^2, σ_2^2p12、p22, ρ, ce sont les paramètres de la distribution normale bidimensionnelle, et leurs plages de valeurs possibles sont :
a, b∈(-∞, +∞), σ 1 > 0 , σ 2 > 0 σ_1>0, σ_2>0p1>0 , p2>0,ρ∈(-1,1)
La distribution normale bidimensionnelle est souvent enregistrée sous la forme N(a, b, σ 1 2 , σ 2 2 σ_1^2, σ_2^2p12、p22, ρ) , son graphe de fonctions dans l'espace tridimensionnel est comme une cloche à section elliptique renversée sur le plan Ox1x2, et son centre est au point (a, b).
peut prouver N(a,b,σ 1 2 、 σ 2 2 σ_1^2、σ_2^2p12、p22, **ρ)** satisfait aux exigences de la formule (2.6), il s'agit donc d'une fonction de densité de probabilité.
3.7 Points à noter sur les variables aléatoires continues
- Qu'il s'agisse d'une variable aléatoire continue unidimensionnelle ou multidimensionnelle, l'essence de la définition est qu'il doit y avoir une fonction de densité de probabilité (car unidimensionnel est une variable) qui satisfait la formule (2.6);
- Il n'est pas nécessaire que la fonction de densité de probabilité soit continue dans un intervalle ou une zone ;
- Chaque composante d'un vecteur aléatoire continu est une variable aléatoire, mais ce n'est pas nécessairement un vecteur aléatoire si chaque composante est une variable aléatoire ;
- La fonction de distribution de probabilité peut être utilisée pour décrire la distribution de probabilité de vecteurs aléatoires multidimensionnels, qui est définie comme : F(x1,x2,…,xn)=P(X1<x1,X2<x2,…,Xn<xn), mais dans le cas de Next multidimensionnel, la fonction de distribution est rarement utilisée.
3.8 Distribution marginale
Soit X=(X1,...,Xn) un vecteur aléatoire à n dimensions, X a une certaine distribution F, qui est une distribution à n dimensions, car chaque composante Xi de X est une variable aléatoire à une dimension, donc ils ont leur propre La distribution Fi(i=1,···,n), ce sont des distributions unidimensionnelles, appelées la distribution marginale distribution marginale . La distribution marginale est entièrement déterminée par la distribution originale F.
3.8.1 Distribution marginale des vecteurs aléatoires discrets
En prenant la première composante comme exemple, la formule de calcul de la densité de probabilité de la distribution marginale des vecteurs aléatoires discrets est :
On peut prouver que pour la distribution multinomiale M(N;p1,...,pn), la marge marginale correspondante est la distribution binomiale B (N,pi).
3.8.2 Distribution marginale des vecteurs aléatoires continus
Supposons que le vecteur aléatoire X=(X1,...,Xn) a une fonction de densité de probabilité f(x1,...,xn), la fonction de densité de probabilité de la distribution marginale de sa composante Xi est de fixer xi, et la n-1 variables restantes de la fonction f Faire une intégrale définie entre -∞ et +∞, comme sous la fonction de densité de x1 :
De cette façon, on peut prouver que la distribution marginale de la distribution normale bidimensionnelle est une distribution normale unidimensionnelle.
4. Résumé
Cet article présente le concept de vecteurs aléatoires multidimensionnels, la définition de leur fonction de densité de probabilité et la définition de la distribution marginale, et donne des exemples de distributions typiques de vecteurs aléatoires multidimensionnels tels que la distribution multinomiale, la distribution uniforme et la distribution normale. Les vecteurs aléatoires multidimensionnels sont également divisés en deux types : discrets et continus. La distribution marginale est une distribution ordinaire, mais une ou plusieurs composantes sont considérées comme des variables, et le reste des composantes sont des distributions obtenues par intégration globale. Par conséquent, la la distribution marginale peut être Elle peut être unidimensionnelle ou multidimensionnelle.
Correspondant à la distribution marginale, le vecteur aléatoire multidimensionnel est aussi appelé distribution conjointe .
La distribution F de tout vecteur aléatoire peut déterminer la distribution marginale Fi de l'une de ses composantes, mais même connaître la distribution marginale Fi de toutes les composantes n'est pas suffisant pour déterminer la distribution F du vecteur aléatoire . Par exemple, si le paramètre ρ de deux distributions normales standard est différent, les deux sont respectivement considérés comme la distribution marginale du vecteur aléatoire bidimensionnel, et les vecteurs aléatoires correspondants sont des distributions différentes. En effet, la distribution marginale ne considère que le cas d'un seul composant et ne considère pas sa relation.
Pour plus de fondements mathématiques de l'intelligence artificielle, veuillez vous référer à la colonne " [Fondements mathématiques de l'intelligence artificielle] One-Dimensional (https://blog.csdn.net/laoyuanpython/category_10382948.html)".
Bloguer n'est pas facile, veuillez soutenir :
Si vous avez gagné quelque chose en lisant cet article, veuillez aimer, commenter et mettre en signet, merci pour votre soutien !
Colonnes payantes sur Old Ape
- La colonne payante " https://blog.csdn.net/laoyuanpython/category_9607725.html Utilisation de PyQt pour développer des applications Python d'interface graphique " présente spécifiquement le didacticiel de base du développement d'interface graphique PyQt basé sur Python, et le répertoire d'articles correspondant est " https ://blog.csdn .net/LaoYuanPython/article/details/107580932 Utiliser PyQt pour développer une interface graphique répertoire de colonne d'application Python ";
- La colonne payante " https://blog.csdn.net/laoyuanpython/category_10232926.html colonne de développement audio et vidéo moviepy ) présente en détail les méthodes liées aux classes de traitement de synthèse de clips audio et vidéo moviepy et l'utilisation de méthodes associées pour traiter scènes de synthèse de clips associées, articles correspondants .
- La colonne payante " https://blog.csdn.net/laoyuanpython/category_10581071.html OpenCV-Python Beginners Difficult Questions Collection " est " https://blog.csdn.net/laoyuanpython/category_9979286.html OpenCV-Python Graphics and Image Traitement " La colonne d'accompagnement est l'intégration de la perception personnelle de l'auteur de certains problèmes rencontrés dans l'apprentissage du graphisme OpenCV-Python et du traitement d'images. Pour comprendre OpenCV, le répertoire d'articles correspondant est " https://blog.csdn.net/LaoYuanPython /article/details/109713407 OpenCV-Python Beginners Difficult Problem Collection Column Directory "
- La rubrique payante " https://blog.csdn.net/laoyuanpython/category_10762553.html Introduction to Python Crawlers" présente le contenu du développement de crawler du point de vue d'un novice en développement front-end Internet, y compris les connaissances de base de l'introduction de crawler, et les connaissances de base du développement de crawler.Obtenez des informations sur les articles CSDN, des informations sur les blogueurs, donnez des articles comme, des commentaires et d'autres contenus de combat réels.
Les deux premières colonnes conviennent aux lecteurs novices qui ont une certaine base Python mais aucune connaissance pertinente.La troisième colonne combine s'il vous plaît l'apprentissage " https://blog.csdn.net/laoyuanpython/category_9979286.html OpenCV-Python Graphics and Image Processing " utiliser.
Pour les collègues qui n'ont pas les bases de Python, vous pouvez apprendre Python à partir de zéro via la colonne gratuite de Lao Yuan " https://blog.csdn.net/laoyuanpython/category_9831699.html Column: Python Basic Tutorial Catalog ).
Si vous êtes intéressé et souhaitez soutenir les lecteurs de Laoyuan, vous pouvez acheter des colonnes payantes.