El objetivo de este documento es delinear los pasos EDA (Análisis exploratorio de datos) para el marco de datos de superconductividad en el catálogo de conjuntos de datos UCI ml (https://archive.ics.uci.edu/dataset/464/superconductivty+data).
Este EDA es parte de un proyecto más grande para predecir la temperatura crítica y la composición química de un material en función de la entrada de algunos usuarios. Puede encontrar más información aquí (https://burnt-layer-3b0.notion.site/Product-Specs-a7b5c13b376a415fa9a750d0b7b47f04?pvs=4).
Primero cargamos los datos con pandas.
#importing pandas
import pandas as pd
import os
#loading dataset
superc_df= pd.read_csv("/content/drive/MyDrive/superconductivty+data (1)/train.csv")
superc_df.head()
number_of_elements mean_atomic_mass wtd_mean_atomic_mass gmean_atomic_mass wtd_gmean_atomic_mass entropy_atomic_mass wtd_entropy_atomic_mass range_atomic_mass wtd_range_atomic_mass std_atomic_mass ... wtd_mean_Valence gmean_Valence wtd_gmean_Valence entropy_Valence wtd_entropy_Valence range_Valence wtd_range_Valence st