Introduction à ce chapitre
Qu'est-ce que le formatage des données
Préface:
-Après avoir étudié ce chapitre, vous aurez une perspective normalisée / formatée sur les données
-Méthodologie: Comprendre les fichiers et la représentation des données dans une perspective Python
-Capacité pratique: apprendre à écrire des programmes avec entrée et sortie de fichier
1. Dimensions de l'organisation des données
Dimension: organisation d'un ensemble de données linéaires ou bidimensionnelles ou supérieures
Données unidimensionnelles: elles sont composées de données ordonnées ou désordonnées dans une relation peer-to-peer, organisées de manière linéaire
Données bidimensionnelles: il est composé de plusieurs données unidimensionnelles, qui sont une combinaison de données unidimensionnelles (un tableau est une donnée bidimensionnelle typique et l'en-tête fait partie des données bidimensionnelles)
Données multidimensionnelles: l'expansion des données unidimensionnelles ou bidimensionnelles dans une nouvelle dimension
2. Cycle de fonctionnement des données
Stockage <-> signifie <-> opération - un total de trois étapes
3. Représentation de données unidimensionnelles
Ordonné, utiliser la liste
Non ordonné, utiliser l'ensemble
Les listes et les collections peuvent être utilisées pour parcourir les données avec for
4. Stockage de données unidimensionnelles
Méthode 1: utilisez un ou plusieurs espaces pour séparer, sans sauts de ligne,
tels que: Chine, États-Unis, Japon, Italie
Restrictions: aucun espace ne peut exister dans les données
Méthode 2: utilisez des virgules demi-largeur anglaises pour séparer sans saut de ligne,
par exemple: Chine, États-Unis, Japon et Italie.
Restrictions: les virgules anglaises ne peuvent pas être incluses dans les données
Autres méthodes: utilisez des symboles spéciaux pour séparer
5. Traitement des données unidimensionnel
Exemple 1
f = open("E:/code/python/821/fname.txt",encoding="utf-8")
txt = f.read()
ls = txt.split()
f.close()
print(ls)
输出
['中国', '美国', '日本', '意大利', '德国', '法国', '英国', '意大利']
Exemple 2
ls = ['新疆','北京','大连']
f = open("E:/code/python/821/fname.txt","w",encoding="utf-8")
f.write(" ".join(ls))
f.close()
Afficher le fichier à ce moment
Résumé: read-split () write-join ()
6. Représentation de données bidimensionnelles
Utilisez généralement une liste à deux dimensions et chaque élément de la liste est une liste
Utilisez une boucle for à deux niveaux pour parcourir chaque élément
7. Format CSV et stockage de données 2D
CSV: Valeurs séparées par des virgules-Valeurs séparées par des virgules -Format de
stockage de données à une et deux dimensions utilisé en international, extension générale .csv
-une donnée unidimensionnelle par ligne, séparée par des virgules, pas de lignes vides-
Excel et un logiciel d'édition général peuvent être utilisés Lire ou enregistrer en tant que fichier .csv
Convention
-si un élément est manquant, la virgule doit encore être tabulée
-l'en-tête des données bidimensionnelles peut être stocké sous forme de données ou stocké séparément
Si un élément contient une virgule, vous devez ajouter des guillemets des deux côtés de l'élément, indiquant que la virgule n'est pas utilisée pour séparer l'élément
Habitudes générales d'indexation: première ligne, puis colonne ls [ligne] colonne
8. Traitement bidimensionnel des données
Exemple 1
fo = open(fname)
ls = []
for line in fo:
line = line.replace("\n","")#根据每行结束都有回车的习惯
ls.append(line.split(","))#括号内得到由,分隔开的列表
fo.close()
Exemple 2 Écrire des données dans un fichier au format CSV
ls = [[],[],[]] #二维列表
f = open(fname,'w')
for item in ls:
f.write(','.join(item) + "\n")
f.close()
Exemple 3 Traverse
ls = [[1,2],[3,4],[5,6]] #二维列表
for row in ls:
for column in row:
print(column)
输出
1
2
3
4
5
6
Source: MOOC BIT Python