使用wget从Google Drive下载数据集

许多用于训练的数据集很大,一般通过Google Drive进行分享,而出于磁盘容量和方便训练的考虑,这些数据我们一般放在服务器上,服务器没有图形界面,因此我们需要使用wget来进行下载。

Google Drive的链接格式是这个样子的:

https://drive.google.com/file/d/<fileid>/view

我们要关注的是<field>,这相当于文件的编号。以cascade-stereo分享的DTU数据集为例,Google Drive的链接如下

https://drive.google.com/file/d/1eDjh-_bxKKnEuz5h-HXS7EDJn59clx6V/view

我们将这个编号命名为${field},将我们希望它保存成的文件名命名为${name},那么通过wget下载的命令如下:

sudo wget --load-cookies /tmp/cookies.txt "https://drive.google.com/uc?export=download&confirm=$(wget --quiet --save-cookies /tmp/cookies.txt --keep-session-cookies --no-check-certificate 'https://drive.google.com/uc?export=download&id=${field}' -O- | sed -rn 's/.*confirm=([0-9A-Za-z_]+).*/\1\n/p')&id=${field}" -O ${filename} && rm -rf /tmp/cookies. txt

我们只需要将变量替换即可,注意有两个地方有${field},有一个地方有${filename}。

下载完成之后,只需要使用unrar解压rar文件到当前文件夹下即可

unrar x test.rar 

猜你喜欢

转载自blog.csdn.net/YuhsiHu/article/details/123259851