Réponses aux exercices parascolaires de prétraitement et d'agrégation de données et d'opérations de regroupement de données Pandas

Réponses aux exercices parascolaires de prétraitement et d'agrégation de données et d'opérations de regroupement de données Pandas

Chapitre 4

insérer la description de l'image ici

insérer la description de l'image ici

Question à réponse courte Question à
réponse courte
1. Dans le processus de prétraitement des données, une méthode de traitement appropriée sera sélectionnée en fonction de la situation réelle des données. Les opérations de prétraitement couramment utilisées comprennent le nettoyage des données, la fusion des données, le remodelage des données et la conversion des données. Parmi ces opérations Ils contiennent également différentes méthodes de traitement des données, telles que la détection des valeurs nulles et manquantes, le traitement des valeurs répétées et le traitement des valeurs aberrantes dans le processus de nettoyage des données.
2. Les opérations de fusion de données couramment utilisées dans Pandas sont : la fonction concat() signifie empiler plusieurs objets le long d'un axe, la fonction merge() signifie fusionner différents objets en fonction d'une ou plusieurs clés et la méthode join(). signifie fusionner les données en fonction de l'index ou de la colonne spécifiée, et la méthode combine_first() signifie remplir les données fusionnées.
Question du programme
1. Réponse :
importer des pandas en tant que PD

importer numpy en tant que np

group_a = pd.DataFrame({'A' : [2,3,5,2,3],

                         'B': ['5',np.nan,'2','3','6'],

                         'C': [8,7,50,8,2],

                       'key': [3,4,5,2,5]})

group_b = pd.DataFrame({'A' : [3,3,3],

                    'B': [4,4,4],

                    'C': [5,5,5]})

imprimer (groupe_a)

imprimer (groupe_b)

2.答案:
group_a = group_a.combine_first(group_b)

groupe A

3.答案:
group_a.rename(columns={'key':'D'})

Chapitre 5

insérer la description de l'image ici

insérer la description de l'image ici
Question à réponse courte
1. Le processus d'agrégation de groupes est généralement divisé, appliqué et fusionné. Le fractionnement consiste à diviser l'ensemble de données en plusieurs groupes selon certaines règles ; l'application est le processus d'exécution d'une série d'opérations sur les données regroupées ; la fusion consiste à intégrer les résultats de ces opérations.

2. Il existe principalement quatre méthodes de regroupement couramment utilisées, à savoir : liste ou tableau, la longueur de la liste ou du tableau doit être cohérente avec la longueur de l'axe de regroupement, le nom d'une colonne dans l'objet DataFrame, dictionnaire ou Series, et fonction.

Question du programme
1. Réponse :
importer des pandas en tant que PD

studnets_data = pd.DataFrame({'Grade':['Freshman','Sophomore','Junior',

                                        '大四','大二','大三',

                                         '大一','大三','大四'],

                               '姓名':['李宏卓','李思真','张振海',

                                       '赵鸿飞','白蓉','马腾飞',

                                       '张晓凡','金紫萱','金烨'],

                               '年龄':[18,19,20,21,

                                        19,20,18,20,21],

                               '身高':[175,165,178,175,

                                       160,180,167,170,185],

                               '体重':[65,60,70,76,55,

                                       70,52,53,73]})

data = studnets_data.groupby('grade')

Freshman = dict([x pour x dans les données])['大一']

imprimer (étudiant de première année)

2. Réponse :
data = data.apply(max)

supprimer les données['grade']

imprimer (données)

3. Réponse :
Junior = dict([x pour x dans les données])['junior']

print(Freshman['poids'].apply('mean'))

print(Junior['poids'].apply('mean'))

à suivre

Je suppose que tu aimes

Origine blog.csdn.net/qq_68890680/article/details/130177345
conseillé
Classement