Objectif initial : la distribution requise p doit être déduite à partir des données existantes ;
Lorsque p n'est pas facile à exprimer et ne peut pas être résolu directement, vous pouvez essayer d'utiliser la méthode d' inférence variationnelle
C'est-à-dire : trouver une distribution q facile à exprimer et à résoudre. Lorsque l'écart entre q et p est petit, q peut être utilisé comme une distribution approximative de p et devenir le résultat de sortie ;
Dans ce processus, notre point clé a changé, passant du problème d'inférence de "recherche de distribution" au problème d'optimisation de "rétrécissement de la distance" .
<Série de base> 1 : Probabilité a priori et probabilité a posteriori - Article stupide - Zhihu https://zhuanlan.zhihu.com/p/38567891
Formule de probabilité totale: C'est l'idée de "déduire l'effet de la cause".Lorsque la cause d'un certain événement est connue, la probabilité d'occurrence de l'événement causé par une certaine cause est déduite.
Formule bayésienne : C'est l'idée de "de l'effet à la cause". Lorsque le résultat d'un certain événement est connu, la probabilité que l'événement soit causé par diverses raisons peut être déduite du résultat.
- La "probabilité" décrit la plausibilité du résultat compte tenu des paramètres du modèle, sans faire référence à aucune donnée observée
- "Probabilité" décrit si les paramètres du modèle sont raisonnables compte tenu d'observations spécifiques
exemple:
Supposons qu'une école compte 60 % de garçons et 40 % de filles. Les filles portent autant de pantalons que de jupes et tous les garçons portent des pantalons.
Probabilité a priori
Une personne voit au loin un élève au hasard, quelle est la probabilité que cet élève soit une fille ?
Lorsqu'il n'y a pas d'observations, la probabilité jugée entièrement basée sur l'expérience est appelée probabilité a priori .
Probabilité postérieure
On aperçoit au loin un étudiant en pantalon au hasard .
Une fois la valeur d'observation disponible, la probabilité d'occurrence d'événements non observés peut être déduite de la valeur d'observation, appelée probabilité postérieure .
Comment comprendre l'inférence variationnelle de manière simple et compréhensible ? - La réponse de Guo Xiaobaa - Zhihu https://www.zhihu.com/question/41765860/answer/331070683
Creuser une fosse, à suivre......