Formatage et traitement Python de données unidimensionnelles et bidimensionnelles

Introduction à ce chapitre

Qu'est-ce que le formatage des données
Insérez la description de l'image ici

Préface:
-Après avoir étudié ce chapitre, vous aurez une perspective normalisée / formatée sur les données
-Méthodologie: Comprendre les fichiers et la représentation des données dans une perspective Python
-Capacité pratique: apprendre à écrire des programmes avec entrée et sortie de fichier

1. Dimensions de l'organisation des données

Dimension: organisation d'un ensemble de données linéaires ou bidimensionnelles ou supérieures

Données unidimensionnelles: elles sont composées de données ordonnées ou désordonnées dans une relation peer-to-peer, organisées de manière linéaire

Données bidimensionnelles: il est composé de plusieurs données unidimensionnelles, qui sont une combinaison de données unidimensionnelles (un tableau est une donnée bidimensionnelle typique et l'en-tête fait partie des données bidimensionnelles)

Données multidimensionnelles: l'expansion des données unidimensionnelles ou bidimensionnelles dans une nouvelle dimension

2. Cycle de fonctionnement des données

Stockage <-> signifie <-> opération - un total de trois étapes
Insérez la description de l'image ici

3. Représentation de données unidimensionnelles

Ordonné, utiliser la liste
Non ordonné, utiliser l'ensemble

Les listes et les collections peuvent être utilisées pour parcourir les données avec for

4. Stockage de données unidimensionnelles

Méthode 1: utilisez un ou plusieurs espaces pour séparer, sans sauts de ligne,
tels que: Chine, États-Unis, Japon, Italie
Restrictions: aucun espace ne peut exister dans les données

Méthode 2: utilisez des virgules demi-largeur anglaises pour séparer sans saut de ligne,
par exemple: Chine, États-Unis, Japon et Italie.
Restrictions: les virgules anglaises ne peuvent pas être incluses dans les données

Autres méthodes: utilisez des symboles spéciaux pour séparer

5. Traitement des données unidimensionnel

Exemple 1
Insérez la description de l'image ici

f = open("E:/code/python/821/fname.txt",encoding="utf-8")
txt = f.read()
ls = txt.split()
f.close()
print(ls)
输出
['中国', '美国', '日本', '意大利', '德国', '法国', '英国', '意大利']

Exemple 2

ls = ['新疆','北京','大连']
f = open("E:/code/python/821/fname.txt","w",encoding="utf-8")
f.write(" ".join(ls))
f.close()

Afficher le fichier à ce moment
Insérez la description de l'image ici

Résumé: read-split () write-join ()

6. Représentation de données bidimensionnelles

Utilisez généralement une liste à deux dimensions et chaque élément de la liste est une liste
Utilisez une boucle for à deux niveaux pour parcourir chaque élément

7. Format CSV et stockage de données 2D

CSV: Valeurs séparées par des virgules-Valeurs séparées par des virgules -Format de
stockage de données à une et deux dimensions utilisé en international, extension générale .csv
-une donnée unidimensionnelle par ligne, séparée par des virgules, pas de lignes vides-
Excel et un logiciel d'édition général peuvent être utilisés Lire ou enregistrer en tant que fichier .csv
Convention
-si un élément est manquant, la virgule doit encore être tabulée
-l'en-tête des données bidimensionnelles peut être stocké sous forme de données ou stocké séparément

Si un élément contient une virgule, vous devez ajouter des guillemets des deux côtés de l'élément, indiquant que la virgule n'est pas utilisée pour séparer l'élément

Habitudes générales d'indexation: première ligne, puis colonne ls [ligne] colonne

8. Traitement bidimensionnel des données

Exemple 1

fo = open(fname)

ls = []

for line in fo:
    line = line.replace("\n","")#根据每行结束都有回车的习惯
    ls.append(line.split(","))#括号内得到由，分隔开的列表

fo.close()

Exemple 2 Écrire des données dans un fichier au format CSV

ls = [[],[],[]] #二维列表

f = open(fname,'w')

for item in ls:
    f.write(','.join(item) + "\n")
f.close()

Exemple 3 Traverse

ls = [[1,2],[3,4],[5,6]] #二维列表

for row in ls:
    for column in row:
        print(column)
输出
1
2
3
4
5
6

Source: MOOC BIT Python