Parte Seis: Técnicas de Visualização de Dados

Autor: Zen e a arte da programação de computadores

1. Introdução

A visualização de dados (Visualização de Dados) refere-se à exibição de dados em gráficos, imagens e informações, e à apresentação intuitiva dos resultados da análise de dados e dos processos de tomada de decisão. A visualização de dados é um método para ajudar os usuários de forma rápida e eficaz a compreender e descobrir relações e leis de dados, e é uma das maneiras mais importantes de compreender dados em sistemas complexos. Com base em minha própria pesquisa e experiência de trabalho, este artigo resume algumas habilidades e métodos sobre visualização de dados, na esperança de ajudar todos a compreender e usar melhor as ferramentas de visualização de dados para melhorar a análise e os recursos de processamento de dados. A visualização de dados é dividida principalmente em duas categorias – visualização estática e visualização dinâmica. A visualização estática é geralmente usada para apresentar alterações em intervalos regulares ou durante um longo período de tempo; a visualização dinâmica é usada para apresentar alterações em tempo real em eventos instantâneos. Neste artigo, nos concentramos principalmente nas técnicas e métodos relevantes de visualização de dados estáticos, incluindo tipos básicos de visualização, como histogramas, gráficos de barras e gráficos de pizza, bem como tipos de visualização avançados, como visualização de informações geográficas e diagramas de árvore. Por fim, este artigo apresentará brevemente algumas ferramentas de visualização de dados e suas vantagens e desvantagens.

2. Conceitos básicos e explicação terminológica

2.1 Conjunto de dados

Um conjunto de dados refere-se a uma coleção usada para descrever dados. Geralmente, um conjunto de dados contém múltiplas variáveis, e cada variável pode ser considerada como um conjunto de observações. Por exemplo, um conjunto de dados de registros de vendas pode conter variáveis ​​como data de venda, nome do produto, preço do produto, quantidade, vendedor, região de vendas e assim por diante. Cada variável é informação sobre o mesmo tema e está organizada na mesma ordem cronológica. Na visualização de dados, geralmente usamos conjuntos de dados bidimensionais (também chamados de conjuntos de dados planos) ou conjuntos de dados tridimensionais como entrada.

2.2 Variáveis ​​visuais (Variável)

Variáveis ​​de visualização são variáveis ​​usadas para representar dados. Normalmente, uma variável de visualização é geralmente uma coleção de observações. Uma variável pode ser um valor contínuo ou uma variável categórica discreta. Por exemplo, a variável “peso”

おすすめ

転載: blog.csdn.net/universsky2015/article/details/132798304