Linux命令之wget命令

一、wget命令简介

    wget 是一个从网络上自动下载文件的自由工具,支持通过 HTTP、HTTPS、FTP 三个最常见的 TCP/IP协议 下载,并可以使用 HTTP 代理。“wget” 这个名称来源于 “World Wide Web” 与 “get” 的结合。wget工具体积小但功能完善,它支持断点下载功能。支持自动下载,所谓自动下载,是指 wget 可以在用户退出系统的之后在继续后台执行,直到下载任务完成。

二、wget命令安装

[root@test1 ~]# yum install -y wget

三、使用示例

1、下载单个文件

[root@test1 opt]# wget https://download.sun-site.com/wordpress-5.3.2.zip

2、将下载的文件存放到指定的文件夹下并按照指定文件名保存

[root@test1 opt]# wget -O /etc/yum.repos.d/jenkins.repo https://pkg.jenkins.io/redhat/jenkins.repo
–2021-01-11 05:57:32-- https://pkg.jenkins.io/redhat/jenkins.repo
Resolving pkg.jenkins.io (pkg.jenkins.io)… 151.101.78.133, 2a04:4e42:12::645
Connecting to pkg.jenkins.io (pkg.jenkins.io)|151.101.78.133|:443… connected.
HTTP request sent, awaiting response… 200 OK
Length: 71
Saving to: ‘/etc/yum.repos.d/jenkins.repo’


100%[==============================================================================================================================>] 71 --.-K/s in 0s


2021-01-11 05:57:36 (1.52 MB/s) - ‘/etc/yum.repos.d/jenkins.repo’ saved [71/71]


[root@test1 opt]# ll /etc/yum.repos.d/
total 36
-rw-r–r--. 1 root root 1664 Nov 23 2018 CentOS-Base.repo
-rw-r–r--. 1 root root 1309 Nov 23 2018 CentOS-CR.repo
-rw-r–r--. 1 root root 649 Nov 23 2018 CentOS-Debuginfo.repo
-rw-r–r--. 1 root root 314 Nov 23 2018 CentOS-fasttrack.repo
-rw-r–r--. 1 root root 630 Nov 23 2018 CentOS-Media.repo
-rw-r–r--. 1 root root 1331 Nov 23 2018 CentOS-Sources.repo
-rw-r–r--. 1 root root 5701 Nov 23 2018 CentOS-Vault.repo
-rw-r–r--. 1 root root 71 Nov 29 2016 jenkins.repo

3、断点续传

[root@test1 opt]# wget https://download.sun-site.com/lnmp1.6-full.tar.gz
–2021-01-11 05:59:50-- https://download.sun-site.com/lnmp1.6-full.tar.gz
Resolving download.sun-site.com (download.sun-site.com)… 47.103.25.27
Connecting to download.sun-site.com (download.sun-site.com)|47.103.25.27|:443… connected.
HTTP request sent, awaiting response… 200 OK
Length: 709571457 (677M) [application/octet-stream]
Saving to: ‘lnmp1.6-full.tar.gz’


0% [ ] 679,631 160KB/s eta 72m 0s ^C
[root@test1 opt]# ll -h
total 14M
-rw-r–r--. 1 root root 672K Jan 11 05:59 lnmp1.6-full.tar.gz
-rw-r–r--. 1 root root 13M Dec 18 2019 wordpress-5.3.2.zip
[root@test1 opt]# wget -c https://download.sun-site.com/lnmp1.6-full.tar.gz
–2021-01-11 06:00:11-- https://download.sun-site.com/lnmp1.6-full.tar.gz
Resolving download.sun-site.com (download.sun-site.com)… 47.103.25.27
Connecting to download.sun-site.com (download.sun-site.com)|47.103.25.27|:443… connected.
HTTP request sent, awaiting response… 206 Partial Content
Length: 709571457 (677M), 708883634 (676M) remaining [application/octet-stream]
Saving to: ‘lnmp1.6-full.tar.gz’

4、后台下载

[root@test1 opt]# wget -b https://download.sun-site.com/wordpress-5.3.2.zip
Continuing in background, pid 100321.
Output will be written to ‘wget-log’.

5、测试下载链接是否有效

[root@test1 opt]# wget --spider https://download.sun-site.com/wordpress-5.3.2.zip
Spider mode enabled. Check if remote file exists.
–2021-01-11 06:05:35-- https://download.sun-site.com/wordpress-5.3.2.zip
Resolving download.sun-site.com (download.sun-site.com)… 47.103.25.27
Connecting to download.sun-site.com (download.sun-site.com)|47.103.25.27|:443… connected.
HTTP request sent, awaiting response… 200 OK
Length: 13427353 (13M) [application/zip]
Remote file exists.

6、下载多个文件

[root@test1 opt]# wget -i download.txt
在这里插入图片描述

7、下载信息保存到文件,不显示到终端

[root@test1 opt]# wget -o download.log https://download.sun-site.com/hi.txt
[root@test1 opt]# cat download.log
–2021-01-11 06:15:51-- https://download.sun-site.com/hi.txt
Resolving download.sun-site.com (download.sun-site.com)… 47.103.25.27
Connecting to download.sun-site.com (download.sun-site.com)|47.103.25.27|:443… connected.
HTTP request sent, awaiting response… 200 OK
Length: 0 [text/plain]
Saving to: ‘hi.txt’


0K 0.00 =0s


2021-01-11 06:15:51 (0.00 B/s) - ‘hi.txt’ saved [0/0]

8、使用用户名密码下载

[root@test1 opt]# wget --http-user=user–http-password=password https://download.sun-site.com/wordpress-5.3.2.zip
在这里插入图片描述

9、限制下载速率

[root@test1 opt]# wget --limit-rate=100k https://download.sun-site.com/wordpress-5.3.2.zip
在这里插入图片描述

四、命令参数说明

1、启动参数

-V, --version 显示 Wget 的版本信息并退出。
-h, --help 打印此帮助。
-b, --background 启动后转入后台。
-e, --execute=COMMAND 运行一个“.wgetrc”风格的命令。

2、日志和输入文件参数

-o, --output-file=FILE 将日志信息写入 FILE。
-a, --append-output=FILE 将信息添加至 FILE。
-d, --debug 打印大量调试信息。
-q, --quiet 安静模式 (无信息输出)。
-v, --verbose 详尽的输出 (此为默认值)。
-nv, --no-verbose 关闭详尽输出,但不进入安静模式。
–report-speed=TYPE Output bandwidth as TYPE. TYPE can be bits.
-i, --input-file=FILE 下载本地或外部 FILE 中的 URLs。
-F, --force-html 把输入文件当成 HTML 文件。
-B, --base=URL 解析与 URL 相关的HTML 输入文件 (由 -i -F 选项指定)。
–config=FILE Specify config file to use.

3、下载参数

-t, --tries=NUMBER 设置重试次数为 NUMBER (0 代表无限制)。
–retry-connrefused 即使拒绝连接也是重试。
-O, --output-document=FILE 将文档写入 FILE。
-nc, --no-clobber skip downloads that would download to
existing files (overwriting them).
-c, --continue 断点续传下载文件。
–progress=TYPE 选择进度条类型。
-N, --timestamping 只获取比本地文件新的文件。
–no-use-server-timestamps 不用服务器上的时间戳来设置本地文件。
-S, --server-response 打印服务器响应。
–spider 不下载任何文件。
-T, --timeout=SECONDS 将所有超时设为 SECONDS 秒。
–dns-timeout=SECS 设置 DNS 查寻超时为 SECS 秒。
–connect-timeout=SECS 设置连接超时为 SECS 秒。
–read-timeout=SECS 设置读取超时为 SECS 秒。
-w, --wait=SECONDS 等待间隔为 SECONDS 秒。
–waitretry=SECONDS 在获取文件的重试期间等待 1…SECONDS 秒。
–random-wait 获取多个文件时,每次随机等待间隔
0.5WAIT…1.5WAIT 秒。
–no-proxy 禁止使用代理。
-Q, --quota=NUMBER 设置获取配额为 NUMBER 字节。
–bind-address=ADDRESS 绑定至本地主机上的 ADDRESS (主机名或是 IP)。
–limit-rate=RATE 限制下载速率为 RATE。
–no-dns-cache 关闭 DNS 查寻缓存。
–restrict-file-names=OS 限定文件名中的字符为 OS 允许的字符。
–ignore-case 匹配文件/目录时忽略大小写。
-4, --inet4-only 仅连接至 IPv4 地址。
-6, --inet6-only 仅连接至 IPv6 地址。
–prefer-family=FAMILY 首先连接至指定协议的地址
FAMILY 为 IPv6,IPv4 或是 none。
–user=USER 将 ftp 和 http 的用户名均设置为 USER。
–password=PASS 将 ftp 和 http 的密码均设置为 PASS。
–ask-password 提示输入密码。
–no-iri 关闭 IRI 支持。
–local-encoding=ENC IRI (国际化资源标识符) 使用 ENC 作为本地编码。
–remote-encoding=ENC 使用 ENC 作为默认远程编码。
–unlink remove file before clobber.

4、目录参数

-nd, --no-directories 不创建目录。
-x, --force-directories 强制创建目录。
-nH, --no-host-directories 不要创建主目录。
–protocol-directories 在目录中使用协议名称。
-P, --directory-prefix=PREFIX 以 PREFIX/… 保存文件
–cut-dirs=NUMBER 忽略远程目录中 NUMBER 个目录层。

5、HTTP 参数

–http-user=USER 设置 http 用户名为 USER。
–http-password=PASS 设置 http 密码为 PASS。
–no-cache 不在服务器上缓存数据。
–default-page=NAME 改变默认页(默认页通常是“index.html”)。
-E, --adjust-extension 以合适的扩展名保存 HTML/CSS 文档。
–ignore-length 忽略头部的‘Content-Length’区域。
–header=STRING 在头部插入 STRING。
–max-redirect 每页所允许的最大重定向。
–proxy-user=USER 使用 USER 作为代理用户名。
–proxy-password=PASS 使用 PASS 作为代理密码。
–referer=URL 在 HTTP 请求头包含‘Referer: URL’。
–save-headers 将 HTTP 头保存至文件。
-U, --user-agent=AGENT 标识为 AGENT 而不是 Wget/VERSION。
–no-http-keep-alive 禁用 HTTP keep-alive (永久连接)。
–no-cookies 不使用 cookies。
–load-cookies=FILE 会话开始前从 FILE 中载入 cookies。
–save-cookies=FILE 会话结束后保存 cookies 至 FILE。
–keep-session-cookies 载入并保存会话 (非永久) cookies。
–post-data=STRING 使用 POST 方式;把 STRING 作为数据发送。
–post-file=FILE 使用 POST 方式;发送 FILE 内容。
–content-disposition 当选中本地文件名时
允许 Content-Disposition 头部 (尚在实验)。
–content-on-error output the received content on server errors.
–auth-no-challenge 发送不含服务器询问的首次等待
的基本 HTTP 验证信息。

6、HTTPS (SSL/TLS) 参数

–secure-protocol=PR choose secure protocol, one of auto, SSLv2,
SSLv3, TLSv1, TLSv1_1 and TLSv1_2.
–no-check-certificate 不要验证服务器的证书。
–certificate=FILE 客户端证书文件。
–certificate-type=TYPE 客户端证书类型,PEM 或 DER。
–private-key=FILE 私钥文件。
–private-key-type=TYPE 私钥文件类型,PEM 或 DER。
–ca-certificate=FILE 带有一组 CA 认证的文件。
–ca-directory=DIR 保存 CA 认证的哈希列表的目录。
–random-file=FILE 带有生成 SSL PRNG 的随机数据的文件。
–egd-file=FILE 用于命名带有随机数据的 EGD 套接字的文件。

7、FTP 选项参数

–ftp-user=USER 设置 ftp 用户名为 USER。
–ftp-password=PASS 设置 ftp 密码为 PASS。
–no-remove-listing 不要删除‘.listing’文件。
–no-glob 不在 FTP 文件名中使用通配符展开。
–no-passive-ftp 禁用“passive”传输模式。
–preserve-permissions 保留远程文件的权限。
–retr-symlinks 递归目录时,获取链接的文件 (而非目录)。

8、WARC参数

–warc file=FILENAME 将请求/响应数据保存到。warc.gz公司文件。
–warc header=STRING 将字符串插入warcinfo记录。
–warc max size=NUMBER 将warc文件的最大大小设置为NUMBER。
–warc cdx 写cdx索引文件。
–warc dedup=FILENAME 不存储此CDX文件中列出的记录。
–no-warc-compression 不使用GZIP压缩warc文件。
–no-warc-digests 不计算SHA1摘要。
–no warc keep log不将日志文件存储在warc记录中。
–warc tempdir=DIRECTORY WARC作者创建的临时文件的目录位置。

9、递归下载参数

-r, --recursive 指定递归下载。
-l, --level=NUMBER 最大递归深度 (inf 或 0 代表无限制,即全部下载)。
–delete-after 下载完成后删除本地文件。
-k, --convert-links 让下载得到的 HTML 或 CSS 中的链接指向本地文件。
–backups=N before writing file X, rotate up to N backup files.
-K, --backup-converted 在转换文件 X 前先将它备份为 X.orig。
-m, --mirror -N -r -l inf --no-remove-listing 的缩写形式。
-p, --page-requisites 下载所有用于显示 HTML 页面的图片之类的元素。
–strict-comments 用严格方式 (SGML) 处理 HTML 注释。

10、递归接受/拒绝参数

-A, --accept=LIST 逗号分隔的可接受的扩展名列表。
-R, --reject=LIST 逗号分隔的要拒绝的扩展名列表。
–accept-regex=REGEX regex matching accepted URLs.
–reject-regex=REGEX regex matching rejected URLs.
–regex-type=TYPE regex type (posix|pcre).
-D, --domains=LIST 逗号分隔的可接受的域列表。
–exclude-domains=LIST 逗号分隔的要拒绝的域列表。
–follow-ftp 跟踪 HTML 文档中的 FTP 链接。
–follow-tags=LIST 逗号分隔的跟踪的 HTML 标识列表。
–ignore-tags=LIST 逗号分隔的忽略的 HTML 标识列表。
-H, --span-hosts 递归时转向外部主机。
-L, --relative 只跟踪有关系的链接。
-I, --include-directories=LIST 允许目录的列表。
–trust-server-names use the name specified by the redirection
url last component.
-X, --exclude-directories=LIST 排除目录的列表。
-np, --no-parent 不追溯至父目录。

猜你喜欢

转载自blog.csdn.net/carefree2005/article/details/112491043