awk筛选网页中需要的内容 —— 筑梦之路

背景说明

为了实现下载链接的动态更新,将其存放至qq收藏内,每次更新只需要将收藏内的链接更改即可,不需要更改脚本内容。

注:在收藏文件时需要加特殊符号使其与网页源代码区分开来,便于提取链接

awk如何筛选

 常用参数

print        #用来输出数据,其使用格式是:print $1,$2,$3... 其中,各个项目之间需要使用逗号进行分隔,然后在输出时,这些项目会以空白字符串作为分隔符。
NR        #打印行数
NF        #打印列数
-F:        #指定输入字段分隔符,默认为空格。

 示例:

#将提取到的下载链接赋值给变量A,再使用curl -O命令进行下载
#grep命令将包裹在书名号中的内容提取出来《》;awk负责过滤书名号,只保留书名号中的内容部分
A=$(curl -s https://sharechain.qq.com/7c28db2e2bd03cf6375160b0586f41ab|grep -Eo '《.*?》'|awk -F'[《》]' '{print $2}'|head -n 1) && curl -O ${A}

做个笔记

猜你喜欢

转载自blog.csdn.net/qq_34777982/article/details/135018811