wget 的一些选项

wget 学习笔记 翻译自man wget 挑了一些有用的选项

-b wget启动后立即转到后台,如果没有用-o指定outputfile的话,输出被重定向到wget-log中
-e command 指定需要执行的命令
-o logfile 所有的信息都输出到logfile中,没有指定的默认输出到stderr
-a logfile 将输出日志追加到logfile中
-q 关闭wget的输出
-v 更详细的输出,默认为-v
-nv --no-verbose 只输出error 和 basic information
-i file   从file中读取url,如果file被指定为-,则表示从标准输入读取url
-F 当url从文件中输入时,强制作为html文件来对待
-B url 将url添加到相对路径的前面

--bind-address=ADDRESS 在tcp/ip连接时,绑定在ip ADDRESS上,在一台主机有多个ip地址时很有用
-t number 设定重试次数为number,设为0则表示无穷次测试
-O file 下载的所有文件不会自动存储为相应的文件,而是会全部追加到文件file中。如果file被指定为-,则输出到屏幕
注:-O -k结合使用是为了更快的下载单个文件而设计的。
-nc --no-clobber wget下载时,如果不指定-nc -N或者-r,对同一个文件夹下的同名文件,则会默认下载多个copy,并命名为
file.1,file.2... 当-nc指定时,wget拒绝再一次下载同一个文件到同一个目录下面(更新的话则会下载覆盖)
-c 断点续传
-N 打开时间戳
-S 打印http服务器返回的headers和ftp服务器返回的responses
--spider 不下载页面,只是检查页面是否存在
-T seconds 设定网络延时为seconds秒,当与网络交互时,wget可以检查timeout,如果延时太长的话会终止操作。默认的超时时间为
900秒,设为0则永远不会超时。
--limit-rate=amount 限定下载速度,如--limit-rate=20k
wget的限速是通过sleep合适的时间来达到限速的目的,在这个调整过程中需要一定的时间,所以在下载小文件的时候不要奇怪
为什么限速没有很好的起作用呢
-w seconds 在两次下载之间等待seconds秒,这样减轻了服务器的负载,推荐这样。-w 5m 或1h 或 2d,分别代表分钟,小时,天
--waitretry=seconds 并不是每两次下载之间都等待seconds秒,只是在那些下载失败的重试之间等待(选项默认打开)。
-Q quota 指定wget自动下载时的限额(默认为bytes,可以指定为k m等)注:-Q不会影响到单个文件的下载。但如果递归的下载一个页面

时,当下载的超过quota时wget会终止
--no-dns-cache 关闭dns查找缓存。wget运行时默认是会缓存他从dns找到的ip地址,便于对同一host不用再与dns服务器交互。
--user=user
--password=password

目录选项:
-nd 递归下载的时候不要生成递归目录,所有的文件都会被保存在当前目录下,对于同名文件则进行文件名扩展,改为filename.n
-x 和-nd恰好相反。如wget -x http://fly.srk.fer.hr/robots.txt会被存储为fly.srk.fer.hr/robots.txt

http选项
--header=header-line
--proxy-user=user
--proxy-password=password
--referer=url
--post-data=string
--post-file=file
--user-agent=agent-string

ftp选项
--no-remove-listing
--no-passive-ftp

递归选项
-r
-l depth
-m --mirror
-X list 将逗号分割的list中的目录忽略掉

 

转自:http://hi.baidu.com/anonymouslogin/blog/item/e8fd46b131be6752092302b3.html

猜你喜欢

转载自eryk.iteye.com/blog/805347