[Compartir experiencias] Cómo usar API para descargar conjuntos de datos en Kaggle en Windows/Ubuntu

1 descargar la API de Kaggle

1.1 Anaconda ha sido instalada

  • abrir cmd (Windows) / abrir terminal (Ubuntu)

  • conda enable El nombre de su entorno conda
    Aquí mi entorno se llama Pytorch

conda activate Pytorch
  • Luego ejecuta pip install kaggle
pip install kaggle

Si no tiene Anaconda instalado, vaya directamente a la sección 1.2

1.2 Anaconda no está instalada

Abra cmd/terminal directamente y ejecute pip install kaggle

pip install kaggle

2. Descargue el archivo josn en kaggle

  • Abra https://www.kaggle.com, si no tiene una cuenta, regístrela
  • Haga clic en su foto de perfil, luego haga clic en Cuenta
    inserte la descripción de la imagen aquí
  • Aquí en la API, haga clic en Crear nuevo token y luego se descargará un archivo llamado kaggle.json.
    inserte la descripción de la imagen aquí

3 Coloque kaggle.josn en la carpeta .kaggle

3.1 sistema Windows

  • Ingrese a la carpeta C:\Users\su nombre de usuario
    para verificar si la carpeta actual tiene una carpeta llamada .kaggle; si no, cree una
    inserte la descripción de la imagen aquí
  • Copie el archivo .json descargado a la carpeta .kaggle/
    inserte la descripción de la imagen aquí

3.2 sistema ubuntu

  • Ejecute los siguientes comandos uno por uno
cd ~ 
mkdir .kaggle
cd ~/.kaggle/

El significado del comando anterior es ingresar primero al directorio de inicio del usuario actual, luego crear una carpeta .kaggle en este directorio y luego ingresar ~/.kaggle/

  • Copie el archivo .json descargado a ~/.kaggle/

4. Descargue el conjunto de datos

  • Encuentre los datos que desea descargar en Kaggle, copie esta línea de comando
    inserte la descripción de la imagen aquí

4.1 Utilice cmd/terminal para ejecutar el comando de descarga

  • Ingrese la ruta que desea descargar y luego abra cmd/terminal en esta ruta
    inserte la descripción de la imagen aquí
  • Activar el entorno conda (ignorado si anaconda no está instalado)
  • Ingrese el comando que copiamos de kaggl, presione Enter para ejecutar
# 替换成你自己需要在下载的数据集的命令
kaggle competitions download -c birdclef-2023

inserte la descripción de la imagen aquí
Se puede encontrar que el conjunto de datos ha comenzado a descargarse y la velocidad aún es buena.
inserte la descripción de la imagen aquí

4.2 Usando el método VSCode + Jupyter

Ejecute el siguiente comando para iniciar la descarga, el conjunto de datos descargado tendrá la misma ruta que su archivo de código

! kaggle competitions download -c birdclef-2023

inserte la descripción de la imagen aquí

Supongo que te gusta

Origin blog.csdn.net/qq_44319167/article/details/130439380
Recomendado
Clasificación