wget 的一些选项

wget 学习笔记翻译自man wget 挑了一些有用的选项

-b wget启动后立即转到后台，如果没有用-o指定outputfile的话，输出被重定向到wget-log中
-e command 指定需要执行的命令
-o logfile 所有的信息都输出到logfile中，没有指定的默认输出到stderr
-a logfile 将输出日志追加到logfile中
-q 关闭wget的输出
-v 更详细的输出，默认为-v
-nv --no-verbose 只输出error 和 basic information
-i file 从file中读取url，如果file被指定为-，则表示从标准输入读取url
-F 当url从文件中输入时，强制作为html文件来对待
-B url 将url添加到相对路径的前面

--bind-address=ADDRESS 在tcp/ip连接时，绑定在ip ADDRESS上，在一台主机有多个ip地址时很有用
-t number 设定重试次数为number，设为0则表示无穷次测试
-O file 下载的所有文件不会自动存储为相应的文件，而是会全部追加到文件file中。如果file被指定为-，则输出到屏幕
注：-O -k结合使用是为了更快的下载单个文件而设计的。
-nc --no-clobber wget下载时，如果不指定-nc -N或者-r，对同一个文件夹下的同名文件，则会默认下载多个copy，并命名为
file.1,file.2... 当-nc指定时，wget拒绝再一次下载同一个文件到同一个目录下面（更新的话则会下载覆盖）
-c 断点续传
-N 打开时间戳
-S 打印http服务器返回的headers和ftp服务器返回的responses
--spider 不下载页面，只是检查页面是否存在
-T seconds 设定网络延时为seconds秒，当与网络交互时，wget可以检查timeout，如果延时太长的话会终止操作。默认的超时时间为
900秒，设为0则永远不会超时。
--limit-rate=amount 限定下载速度，如--limit-rate=20k
wget的限速是通过sleep合适的时间来达到限速的目的，在这个调整过程中需要一定的时间，所以在下载小文件的时候不要奇怪
为什么限速没有很好的起作用呢
-w seconds 在两次下载之间等待seconds秒，这样减轻了服务器的负载，推荐这样。-w 5m 或1h 或 2d，分别代表分钟，小时，天
--waitretry=seconds 并不是每两次下载之间都等待seconds秒，只是在那些下载失败的重试之间等待（选项默认打开）。
-Q quota 指定wget自动下载时的限额（默认为bytes，可以指定为k m等）注：-Q不会影响到单个文件的下载。但如果递归的下载一个页面

时，当下载的超过quota时wget会终止
--no-dns-cache 关闭dns查找缓存。wget运行时默认是会缓存他从dns找到的ip地址，便于对同一host不用再与dns服务器交互。
--user=user
--password=password

目录选项：
-nd 递归下载的时候不要生成递归目录，所有的文件都会被保存在当前目录下，对于同名文件则进行文件名扩展，改为filename.n
-x 和-nd恰好相反。如wget -x http://fly.srk.fer.hr/robots.txt会被存储为fly.srk.fer.hr/robots.txt

http选项
--header=header-line
--proxy-user=user
--proxy-password=password
--referer=url
--post-data=string
--post-file=file
--user-agent=agent-string

ftp选项
--no-remove-listing
--no-passive-ftp

递归选项
-r
-l depth
-m --mirror
-X list 将逗号分割的list中的目录忽略掉

转自：http://hi.baidu.com/anonymouslogin/blog/item/e8fd46b131be6752092302b3.html

猜你喜欢