[Compartilhamento de experiência] Como usar a API para baixar conjuntos de dados no kaggle no Windows/Ubuntu

1 download da API kaggle

1.1 Anaconda foi instalado

  • abra cmd (Windows) / abra terminal (Ubuntu)

  • conda activate Seu nome de ambiente conda
    Aqui meu ambiente é chamado Pytorch

conda activate Pytorch
  • Em seguida, execute pip install kaggle
pip install kaggle

Se você não possui o Anaconda instalado, vá diretamente para a seção 1.2

1.2 Anaconda não está instalado

Abra o cmd/terminal diretamente e execute pip install kaggle

pip install kaggle

2. Baixe o arquivo josn no kaggle

  • Abra https://www.kaggle.com, se você não possui uma conta, registre uma conta
  • Clique na foto do seu perfil e depois em Conta
    insira a descrição da imagem aqui
  • Aqui na API, clique em Criar Novo Token, e então será baixado um arquivo chamado kaggle.json
    insira a descrição da imagem aqui

3 Coloque kaggle.josn na pasta .kaggle

3.1 Sistema Windows

  • Entre na pasta C:\Users\seu nome de usuário
    para verificar se a pasta atual possui uma pasta chamada .kaggle, caso contrário, crie uma
    insira a descrição da imagem aqui
  • Copie o arquivo .json baixado para a pasta .kaggle/
    insira a descrição da imagem aqui

3.2 Sistema Ubuntu

  • Execute os seguintes comandos um por um
cd ~ 
mkdir .kaggle
cd ~/.kaggle/

O significado do comando acima é inserir primeiro o diretório inicial do usuário atual, depois criar uma pasta .kaggle neste diretório e, em seguida, inserir ~/.kaggle/

  • Copie o arquivo .json baixado para ~/.kaggle/

4. Baixe o conjunto de dados

  • Encontre os dados que deseja baixar no kaggle, copie esta linha de comando
    insira a descrição da imagem aqui

4.1 Use cmd/terminal para executar o comando de download

  • Digite o caminho a ser baixado e abra cmd/terminal no caminho
    insira a descrição da imagem aqui
  • Ative o ambiente conda (ignorado se o anaconda não estiver instalado)
  • Digite o comando que copiamos do kaggl, pressione Enter para executar
# 替换成你自己需要在下载的数据集的命令
kaggle competitions download -c birdclef-2023

insira a descrição da imagem aqui
Pode-se descobrir que o download do conjunto de dados começou e a velocidade ainda está boa
insira a descrição da imagem aqui

4.2 Usando o método VSCode + Jupyter

Execute o seguinte comando para iniciar o download, o conjunto de dados baixado terá o mesmo caminho do seu arquivo de código

! kaggle competitions download -c birdclef-2023

insira a descrição da imagem aqui

Acho que você gosta

Origin blog.csdn.net/qq_44319167/article/details/130439380
Recomendado
Clasificación