Análisis de datos exploratorios superconductores de Python y selección de características para marcos de datos superconductores

El objetivo de este documento es delinear los pasos EDA (Análisis exploratorio de datos) para el marco de datos de superconductividad en el catálogo de conjuntos de datos UCI ml (https://archive.ics.uci.edu/dataset/464/superconductivty+data).

Este EDA es parte de un proyecto más grande para predecir la temperatura crítica y la composición química de un material en función de la entrada de algunos usuarios. Puede encontrar más información aquí (https://burnt-layer-3b0.notion.site/Product-Specs-a7b5c13b376a415fa9a750d0b7b47f04?pvs=4).

inserte la descripción de la imagen aquí

Primero cargamos los datos con pandas.

#importing pandas
import pandas as pd
import os
#loading dataset
superc_df= pd.read_csv("/content/drive/MyDrive/superconductivty+data (1)/train.csv")
superc_df.head()
number_of_elements mean_atomic_mass wtd_mean_atomic_mass gmean_atomic_mass wtd_gmean_atomic_mass entropy_atomic_mass wtd_entropy_atomic_mass range_atomic_mass wtd_range_atomic_mass std_atomic_mass ... wtd_mean_Valence gmean_Valence wtd_gmean_Valence entropy_Valence wtd_entropy_Valence range_Valence wtd_range_Valence st

Supongo que te gusta

Origin blog.csdn.net/iCloudEnd/article/details/132199327
Recomendado
Clasificación