Gráfico de dispersão de ferramentas de qualidade

Indique a fonte da reimpressão original do Yunzhi QMS

Autor: Wang Hongshi

1. O que é um gráfico de dispersão

O gráfico de dispersão (Scatter Plot ou Scatter Chart), também conhecido como gráfico de dispersão, como o nome indica, é um gráfico composto por alguns pontos dispersos, cuja posição é determinada pelos seus valores X e Y. Portanto, também é chamado de gráfico de dispersão XY. Ele exibe todos os dados na forma de pontos no sistema de coordenadas cartesianas para mostrar o grau de interação entre as variáveis, e a posição do ponto é determinada pelo valor da variável.

Ao analisar dados independentes, você pode usar o histograma e Platão para encontrar diretamente o ponto de melhoria, mas quando quiser analisar a correlação entre as duas variáveis ​​X e Y, você precisa usar o gráfico de dispersão. Como a temperatura de têmpera e dureza do aço, o torque e a resistência à tração dos parafusos, a temperatura e a viscosidade do óleo, o teor de chumbo e a resistência à radiação no vidro, etc.

As pessoas costumam usar gráficos de dispersão para expressar a relação entre duas variáveis ​​contínuas X e Y. Cada ponto na figura representa cada amostra no conjunto de dados de destino. A distribuição de pontos de dados no plano de coordenadas cartesianas e a variável dependente varia com o geral tendência da variável. A partir dessa tendência, a função apropriada pode ser selecionada para ajustar a distribuição empírica.Ao mesmo tempo, algumas linhas retas e curvas são frequentemente ajustadas no diagrama de dispersão para representar certos modelos e, em seguida, encontrar a relação funcional entre as variáveis.

2. O papel do gráfico de dispersão

Um gráfico de dispersão exibe uma série como um conjunto de pontos, com valores representados pela posição dos pontos no gráfico e categorias representadas por marcadores distintos no gráfico. Os gráficos de dispersão costumam ser usados ​​para comparar dados agregados entre categorias. Existem muitos aplicativos. Dois aplicativos comuns são resumidos a seguir.

2.1 Análise de regressão

O diagrama de dispersão é usado na análise de regressão. O diagrama de distribuição de pontos de dados no plano do sistema de coordenadas cartesianas. O diagrama de dispersão indica a tendência geral da variável dependente mudando com a variável independente. Com base nisso, uma função apropriada pode ser selecionados para ajustar os pontos de dados.

Após a análise de regressão, o gráfico de dispersão pode prever e analisar objetos relacionados, permitindo-nos descobrir a relação oculta entre as variáveis ​​e, em seguida, tomar decisões científicas em vez de ambigüidade. Por exemplo, o diagrama de dispersão dos preços das casas abaixo pode nos mostrar intuitivamente o aumento dos preços das casas em diferentes cidades e fornecer suporte importante para os ajustes subsequentes da política de preços das casas.

2.2 Análise de correlação

O gráfico de dispersão é usado na análise de correlação. Dois conjuntos de dados são usados ​​para formar vários pontos de coordenadas, e a distribuição dos pontos de coordenadas é examinada para determinar se existe uma certa relação entre as duas variáveis ​​ou para resumir o padrão de distribuição das pontos coordenados.

Observando a distribuição de pontos de dados em um gráfico de dispersão, podemos inferir correlações entre variáveis. Se não houver correlação entre as variáveis, o gráfico de dispersão aparecerá como pontos discretos distribuídos aleatoriamente.Se houver uma certa correlação, a maioria dos pontos de dados será relativamente densa e presente em uma determinada tendência.

O valor principal do gráfico de dispersão está em descobrir a relação entre as variáveis. Não entenda essa relação simplesmente como uma relação de regressão linear. Existem muitos relacionamentos entre variáveis, como relacionamento linear, relacionamento exponencial, relacionamento logarítmico, etc. Claro, nenhum relacionamento também é um relacionamento importante.

A relação de correlação de dados é dividida principalmente em: correlação positiva (os valores de duas variáveis ​​aumentam ao mesmo tempo), correlação negativa (o valor de uma variável aumenta e o valor da outra variável diminui), não correlacionada, correlação linear, correlação exponencial, etc. , que são exibidos no diagrama de dispersão A distribuição aproximada é mostrada na figura abaixo. Esses pontos que estão longe do cluster de pontos são chamados de outliers ou pontos anormais.

Do ponto de vista do PDCA, a aplicação do gráfico de dispersão é resumida da seguinte forma:

3. Deformação do gráfico de dispersão

Com base em diferentes cenários de aplicação, o gráfico de dispersão tem muitas deformações e várias deformações comuns estão listadas abaixo.

  • Matriz do gráfico de dispersão

Quando você deseja examinar a correlação entre várias variáveis ​​ao mesmo tempo, é muito problemático desenhar um diagrama de dispersão simples entre elas, uma a uma. Neste momento, a matriz do gráfico de dispersão pode ser usada para desenhar os gráficos de dispersão entre as respectivas variáveis ​​ao mesmo tempo, para que a correlação principal entre variáveis ​​múltiplas possa ser encontrada rapidamente, o que é especialmente importante ao realizar regressão linear múltipla. A matriz do gráfico de dispersão abaixo mostra a relação entre os totais de pontos da equipe, vitórias, taxa de sucesso de passes e chutes a gol.

  • gráfico de dispersão 3D

Embora a relação entre múltiplas variáveis ​​possa ser observada ao mesmo tempo na matriz do gráfico de dispersão, algumas informações importantes podem ser perdidas se a observação dois por dois do gráfico de dispersão plano for realizada. O gráfico de dispersão tridimensional é para estudar a relação entre as variáveis ​​no espaço tridimensional determinado pelas três variáveis. Como as três variáveis ​​são consideradas ao mesmo tempo, informações que não podem ser encontradas no gráfico bidimensional podem frequentemente ser encontrado. O gráfico de dispersão tridimensional abaixo mostra a relação entre o total de pontos, vitórias e chutes a gol da equipe.

  • gráfico de bolhas

Um gráfico de bolhas pode ser usado para mostrar a relação entre três variáveis. Os dados organizados em colunas em uma planilha (valores x listados na primeira coluna, valores y correspondentes e valores de tamanho de bolha em colunas adjacentes) podem ser plotados em um gráfico de bolhas.

Os gráficos de bolhas são semelhantes aos gráficos de dispersão, exceto pelo fato de permitirem que uma variável de tamanho adicional seja incluída no gráfico. Na verdade, é como traçar um gráfico de três variáveis ​​em duas dimensões. As bolhas são representadas por marcadores de tamanhos variados (indicando importância relativa).

4. Aplicação do gráfico de dispersão

Há muitos benefícios na aplicação de gráficos de dispersão, e os pontos comumente usados ​​são resumidos da seguinte forma:

  • A relação entre a causa e o resultado pode ser encontrada: colete os dados da causa e os dados do resultado e compare-os.
  • Desenhe um diagrama de dispersão para ver os resultados rapidamente: No diagrama de dispersão, os pontos de dados de causa e efeito são representados pelas coordenadas X e Y.
  • Pode-se julgar se existe uma relação ou não: a relação entre os dois conjuntos de dados pode ser claramente compreendida a partir do gráfico de dispersão.

Observação: Se os dados coletados não puderem ser julgados no gráfico, eles devem ser separados da camada primeiro e, em seguida, clicados para desenhar um gráfico de dispersão.

Os dados listados na tabela a seguir são os registros da temperatura de têmpera X e dureza Y de uma determinada peça de aço coletada. Existe uma correlação entre as duas variáveis ​​temperatura de têmpera X e dureza Y?

Se você olhar apenas para os dados da tabela acima, consegue ver quais são as características dos dados acima? Definitivamente não, mas nós o plotamos como um gráfico de dispersão, e os dados claramente têm uma certa tendência.

Será mais óbvio se adicionarmos uma linha de tendência a ele.

 

Acho que você gosta

Origin blog.csdn.net/weixin_60220317/article/details/129591412
Recomendado
Clasificación