awk筛选网页中需要的内容 —— 筑梦之路 - 代码天地

awk筛选网页中需要的内容 —— 筑梦之路

企业开发 2023-12-17 00:52:34 阅读次数: 0

背景说明

为了实现下载链接的动态更新，将其存放至qq收藏内，每次更新只需要将收藏内的链接更改即可，不需要更改脚本内容。

注：在收藏文件时需要加特殊符号使其与网页源代码区分开来，便于提取链接

awk如何筛选

常用参数

print        #用来输出数据，其使用格式是：print $1,$2,$3... 其中，各个项目之间需要使用逗号进行分隔，然后在输出时，这些项目会以空白字符串作为分隔符。
NR        #打印行数
NF        #打印列数
-F：        #指定输入字段分隔符，默认为空格。

示例：

#将提取到的下载链接赋值给变量A，再使用curl -O命令进行下载
#grep命令将包裹在书名号中的内容提取出来《》；awk负责过滤书名号，只保留书名号中的内容部分
A=$(curl -s https://sharechain.qq.com/7c28db2e2bd03cf6375160b0586f41ab|grep -Eo '《.*?》'|awk -F'[《》]' '{print $2}'|head -n 1) && curl -O ${A}

做个笔记

猜你喜欢

转载自blog.csdn.net/qq_34777982/article/details/135018811

awk筛选网页中需要的内容 —— 筑梦之路

bash中(冒号破折号)的用法 —— 筑梦之路

去除Bash 变量中的空白字符 —— 筑梦之路

Nginx 301 https跳转后出现跨域和混合内容问题 —— 筑梦之路

Linux中xfs文件系统元数据损坏修复 —— 筑梦之路

如何从k8s secret中查看域名信息 —— 筑梦之路

FusionPBX 安装 —— 筑梦之路

Helm学习——筑梦之路

nginx-quic 体验——筑梦之路

Centos 7 升级gcc ——筑梦之路

ffmepg.spec 文件 —— 筑梦之路

xargs使用技巧 —— 筑梦之路

KVM 显卡透传 —— 筑梦之路

mariadbackup物理备份使用——筑梦之路

kubectl 获取pod日志 —— 筑梦之路

Harbor修改admin的密码 —— 筑梦之路

rpm命令常用总结 —— 筑梦之路

KVM 脚本管理 —— 筑梦之路

Linux 克隆硬盘方法 —— 筑梦之路

elasticsearch常用操作命令 —— 筑梦之路

Docker && Container 对比 —— 筑梦之路

Rsync同步工具 —— 筑梦之路

linux bash特殊变量 —— 筑梦之路

安全基线检查脚本—— 筑梦之路

elasticsearch 故障恢复的参考 —— 筑梦之路

Selinux 管理（安全加固） —— 筑梦之路

容器资源视图隔离 —— 筑梦之路

openssl 用法整理 —— 筑梦之路

Docker build 技巧 —— 筑梦之路

vsftp 使用虚拟用户 —— 筑梦之路

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)