visualización de datos Distribución

univariado

1, la displot histograma

seaborn.distplot (a, papeleras = Ninguno, hist = True, kde = True, alfombra = False, ajuste = Ninguno, hist_kws = Ninguno, kde_kws = ninguno, rug_kws = ninguno, fit_kws = Ninguno, color = Ninguno, vertical = False, norm_hist = False, axlabel = Ninguno, label = Ninguno, ax = None)

Número de cuadro de contenedores →

hist, ked, alfombra → bool, si me / curva de densidad de distribución de datos /

norm_hist → densidad en función de si la visualización del histograma, si el falso, el recuento de display

{Hist, kde, alfombra, aptos} _kws: diccionario, partes correspondientes a varios parámetros.

Ya sea visualización vertical horizontal →

ajustes → scipy se puede incorporar en la biblioteca de imágenes encaja

etiqueta → Legend

axlabel → x eje marcado

archivo

archivo

archivo

archivo

2, estimación de densidad kernel figura kdeplot

Paso estimación de densidad kernel:

  • Cada observación con una cerca de aproximación normal curva de distribución

  • Todas las observaciones superponen curva de distribución normal

normalizado

seaborn.kdeplot (datos, datos2 = Ninguno, sombra = False, vertical = False, kernel = 'Gau', BW = 'Scott', gridSize = 100, corte = 3, clip = Ninguno, leyenda = True, acumulado = Falso, shade_lowest = True, cbar = False, cbar_ax = 无, cbar_kws = 无, ax = 无, kwargs)

sombra: (contorno cuando se llena con un color o datos bivariados) Si es Verdadero, entonces rellenado con un color del área bajo la curva de KDE

kernel: { 'gau' | 'cos' | 'BIW' | 'epa' | 'tri' | 'triw'} para el montaje de núcleo, puede bivariante valores de kernel de Gauss (GAU)

BW: { 'scott' | 'silverman' | escalar |} determina un par de tamaño nuclear escalar, entendida como la aproximación ajuste, mayor BW, la curva más suave.

gridSize: int, puntos de cuadrícula discretas

acumulativo: si dibujar una distribución acumulativa

cbar: Si el parámetro es True, se añade una barra de color (sólo color de la barra de imagen kde bivariante)

archivo

archivo

archivo

archivo

distribución de la densidad nuclear figura puede sacar solamente una sola variable, las variables se pueden trazar bis!

archivo

archivo

bivariante

1, jointplot

seaborn.jointplot (x, y, datos = Ninguno, tipo = 'dispersión', color = Ninguno, tamaño = 6, ratio = 5, el espacio = 0,2, dropna = True, xlim = Ninguno, ylim = Ninguno, joint_kws = Ninguno, marginal_kws = Ninguno, annot_kws = Ninguno, kwargs)

Esta función es una interfaz de clase JoinGrid ligero, si desea dibujar más flexible, se puede utilizar la función JoinGrid.

tipo: Tipo de juego de: "dispersión", "reg", "residuo", "kde", "hexagonal"

tamaño: int, el tamaño de la imagen (la imagen se ajusta automáticamente a un cuadrado)

de radio: relación altura int, y un mapa de borde principal de la fig.

el espacio: # Conjunto mapa principal, y el paso del borde del mapa

{X, Y} lim: eje dispuesto antes de los límites de dibujo

{Conjunta, marginal, Annot} _kws: otras palabras clave de estirar parámetros dicts

archivo

archivo

Seaborn directamente dado coeficiente de correlación de Pearson y el valor de la variable P

Pearson coeficiente de correlación cálculo:

archivo

p: probabilidad de error causado por la diferencia entre las muestras de muestreo es menor que p.

archivo

archivo

archivo

archivo

archivo

2, JointGrid

Recall jointplot JoinGrid realmente un paquete, con el fin de tener una configuración más flexible, puede utilizarse clase JoinGrid.

init (x, y, datos = Ninguno, tamaño = 6, ratio = 5, el espacio = 0,2, dropna = True, xlim = Ninguno, ylim = None)

métodos:

plot (joint_func, marginal_func, annot_func) → dibujar la gráfica completa

plot_joint (func, kwargs **) → dibujo gráfica bivariada

plot_marginals (FUNC, kwargs **) → dibujo univariado borde del patrón

savefig (args, kwargs *) → 保存

set_axis_labels ([xlabel, ylabel]) → dispuestos bivariante eje eje etiquetas.

archivo

archivo

archivo

archivo

archivo

archivo

Explorar la relación entre los dos bivariante

En general, nuestros datos no es sólo una o dos variables, luego por una serie de variables, a menudo necesitamos para explorar la distribución y la relación bivariada entre los dos es que necesitamos función de uso pairplot o una clase de PairGrid.

3, pairplot

seaborn.pairplot (datos, hue = Ninguno, hue_order = Ninguno, paleta = Ninguno, vars = ninguno, x_vars = ninguno, y_vars = ninguno, tipo = 'dispersión', diag_kind = 'auto', marcadores = Ninguno, s = 2,5, aspecto = 1, dropna = True, plot_kws = Ninguno, diag_kws = Ninguno, grid_kws = None)

tonalidad: string (nombres de variables): color se clasifica de acuerdo a la variable especificada

hue_order: lista de señales de ajuste de nivel variable de la paleta de colores

Paleta: Paleta

vars: lista de lista de nombre de variable, de lo contrario usar todas las columnas de las variables numéricas

marcadores: Estilo de punto

archivo

sepal_length sepal_width petal_length petal_width especies

5,1 3,5 1,4 0,2 sedoso

4,9 3,0 1,4 0,2 sedoso

4,7 3,2 1,3 0,2 sedoso

4,6 3,1 1,5 0,2 sedoso

5,0 3,6 1,4 0,2 sedoso

archivo

archivo

archivo

4, PairGrid

Equivalente a la jointplot relación y JointGrid, diagrama de dispersión matricial PairGrid tiene un control más flexible

init (datos, hue = ninguno, hue_order = ninguno, paleta = ninguno, hue_kws = Ninguno, vars = ninguno, x_vars = ninguno, y_vars = Ninguno, diag_sharey = True, tamaño = 2,5, aspecto = 1, Despine = True, dropna = Cierto)

métodos:

add_legend ([legend_data, título, label_order]) una leyenda dibujado, puede ser colocado fuera del eje y ajustar el tamaño del patrón.

map_diag (FUNC, ** kwargs): Dibujo Figura función univariante que tiene en cada sub figura diagonal.

map_lower (func, kwargs **): función de dos variables dibujo La figura con la figura inferior sub-diagonal.

map_upper (func, kwargs **): Dibujo con la función de dos variables figura en el submapa diagonal

map_offdiag (FUNC, ** kwargs): función de dos variables dibujo La figura que tiene en diagonal sub figura.

conjunto (kwargs **): establecer una propiedad de cada cartera sub ejes.

archivo

archivo

Publicado 38 artículos originales · ganado elogios 1 · vistas 2186

Supongo que te gusta

Origin blog.csdn.net/wulishinian/article/details/104916886
Recomendado
Clasificación