Une brève introduction aux boîtes à moustaches

1 Introduction aux boîtes à moustaches

Boîte à moustaches, utilisée comme graphique statistique montrant la répartition des données dans un ensemble de données.
Avantages : non affecté par les valeurs aberrantes, il peut décrire avec précision et de manière stable la distribution discrète des données
insérez la description de l'image ici

Un exemple : un ensemble de nombres 12, 15, 17, 19, 20, 23, 25, 28, 30, 33, 34, 35, 36, 37 (14 au total) paramètres importants : 1. Quartile inférieur Q1 : égal à la position du 25e centile nombre Q1 après que toutes les valeurs de l'échantillon sont classées de petit à grand = (14+1)/4=3,7 5 [0,75 du 3ème + 0,2 du 4ème 5] Q1 =0,25×troisième item+0,75×quatrième item=0,25×17+0,75×19
=
18,5
;
,

2. Médiane (deuxième quartile) Q2 : Le 50e centile de toutes les valeurs de l'échantillon classées de petite à grande

La position de Q2=2×(14+1)/4=7.5
Q2=0.5×7th item+0.5×8th item=0.5×25+0.5×28=26.5;

3. Quartile supérieur Q3 : égal au 75e centile de toutes les valeurs de l'échantillon classées de petite à grande

La position de Q3=3×(14+1)/4=11.25
Q3=0.75×11th item+0.25×12th item=0.75×34+0.25×35=34.25 ;

4. Intervalle interquartile (IQR) :

IQR=Q3-Q1

5. Limite supérieure : la valeur maximale dans la plage non anormale

Limite supérieure=Q3+1.5IQR

6. Limite supérieure : la valeur maximale dans la plage non anormale

Limite inférieure=Q1-1.5IQR

7. Valeurs aberrantes : les valeurs aberrantes entre la limite intérieure et la limite extérieure sont des valeurs aberrantes légères [légères valeurs aberrantes] ||||Les valeurs aberrantes en dehors de la limite extérieure sont des valeurs aberrantes extrêmes [valeurs aberrantes extrêmes]

2 Analyse en boîte à moustaches

  1. Identification des valeurs aberrantes
  2. Jugement de l'asymétrie et du poids de la queue des données
    Pour les échantillons avec une distribution normale standard, seuls quelques-uns sont des valeurs aberrantes. Plus il y a de valeurs aberrantes, plus la queue est lourde et plus le degré de liberté est petit.
    ** L'asymétrie indique le degré d'écart. Si les valeurs aberrantes sont concentrées du côté de la plus petite valeur, la distribution est asymétrique à gauche ; si les valeurs aberrantes sont concentrées du côté de la plus grande valeur, la distribution est asymétrique à droite.
  3. Comparer les formes de plusieurs lots de données selon différents diagrammes en boîte
    À partir du diagramme en boîte, vous pouvez voir la [moyenne, médiane, intervalle de distribution, valeur aberrante] des données

Lien d'apprentissage :

Je suppose que tu aimes

Origine blog.csdn.net/weixin_45913084/article/details/131109460
conseillé
Classement