Introdução a este capítulo
O que é formatação de dados
Prefácio:
-Após estudar este capítulo, você terá uma perspectiva padronizada / formatação de dados
-Metodologia: Noções básicas sobre arquivos e representação de dados de uma perspectiva Python -Habilidade prática
: Aprenda a escrever programas com entrada e saída de arquivo
1. Dimensões da organização de dados
Dimensão: A organização de um conjunto de dados - linear ou bidimensional ou superior
Dados unidimensionais: são compostos de dados ordenados ou desordenados em uma relação ponto a ponto, organizados de maneira linear
Dados bidimensionais: são compostos de vários dados unidimensionais, que são uma combinação de dados unidimensionais (uma tabela é um dado bidimensional típico, e o cabeçalho é uma parte dos dados bidimensionais)
Dados multidimensionais: a expansão de dados unidimensionais ou bidimensionais em uma nova dimensão
2. Ciclo de operação de dados
Armazenamento <-> significa <-> operação - um total de três estágios
3. Representação de dados unidimensionais
Ordenado, usar lista Não ordenado
, usar conjunto
Tanto as listas quanto as coleções podem ser usadas para atravessar dados com
4. Armazenamento de dados unidimensionais
Método 1: Use um ou mais espaços para separar, sem quebras de linha,
como: China, Estados Unidos, Japão, Itália
Restrições: não podem existir espaços nos dados
Método 2: use vírgulas inglesas de meia largura para separar sem quebras de linha,
como: China, Estados Unidos, Japão e Itália.
Restrições: vírgulas inglesas não podem ser incluídas nos dados
Outros métodos: use símbolos especiais para separar
5. Processamento de dados unidimensional
Exemplo 1
f = open("E:/code/python/821/fname.txt",encoding="utf-8")
txt = f.read()
ls = txt.split()
f.close()
print(ls)
输出
['中国', '美国', '日本', '意大利', '德国', '法国', '英国', '意大利']
Exemplo 2
ls = ['新疆','北京','大连']
f = open("E:/code/python/821/fname.txt","w",encoding="utf-8")
f.write(" ".join(ls))
f.close()
Veja o arquivo neste momento
Resumo: read-split () write-join ()
6. Representação de dados bidimensionais
Geralmente usa uma lista bidimensional propriamente dita e cada elemento da lista são listas
Use um loop for de dois níveis para percorrer cada elemento
7. Formato CSV e armazenamento de dados 2D
CSV: Valores separados por vírgulas - Valores separados por vírgulas -
formato de armazenamento de dados unidimensional e bidimensional usado internacionalmente, extensão .csv geral
- um dado unidimensional por linha, separado por vírgulas, sem linhas em branco -
Excel e software de edição geral podem ser usados Ler ou salvar como um arquivo .csv
Convenção
- se um elemento estiver faltando, a vírgula ainda precisa ser tabulada
- o cabeçalho dos dados bidimensionais pode ser armazenado como dados ou armazenado separadamente
Se um elemento contém uma vírgula, você precisa adicionar aspas em ambos os lados do elemento, indicando que a vírgula não é usada para separar o elemento
Hábitos gerais de indexação: primeira linha e depois coluna ls [linha] coluna
8. Processamento de dados bidimensional
Exemplo 1
fo = open(fname)
ls = []
for line in fo:
line = line.replace("\n","")#根据每行结束都有回车的习惯
ls.append(line.split(","))#括号内得到由,分隔开的列表
fo.close()
Exemplo 2 Grave dados em um arquivo no formato CSV
ls = [[],[],[]] #二维列表
f = open(fname,'w')
for item in ls:
f.write(','.join(item) + "\n")
f.close()
Exemplo 3 Traverse
ls = [[1,2],[3,4],[5,6]] #二维列表
for row in ls:
for column in row:
print(column)
输出
1
2
3
4
5
6
Fonte: BIT Python MOOC