实验楼--第十三章挑战 - 代码天地

实验楼--第十三章挑战

其他 2021-02-28 12:48:34 阅读次数: 0

挑战：数据提取

介绍

小明在做数据分析的时候需要提取文件中关于数字的部分，同时还要提取用户的邮箱部分，但是有的行不是数组也不是邮箱，现在需要你在 data2 这个文件中帮助他用正则表达式匹配出数字部分和邮箱部分。

数据文件可以使用以下命令下载：

$ cd /home/shiyanlou
$ wget https://labfile.oss.aliyuncs.com/courses/1/data2

下载后的数据文件路径为 /home/shiyanlou/data2。

目标

在文件 /home/shiyanlou/data2 中匹配数字开头的行，将所有以数字开头的行都写入 /home/shiyanlou/num 文件。
在文件 /home/shiyanlou/data2 中匹配出正确格式的邮箱，将所有的邮箱写入 /home/shiyanlou/mail 文件，注意该文件中每行为一个邮箱。

提示

邮箱的格式匹配
注意符号 . 的处理

我的答案

看到这题首先没有打算用grep去做，而是打算用sed（纯粹学完sed觉得它很nb）,然后墨迹了半天发现邮箱有点难写，但是还好这题目简单啊，直接匹配"@"就可以了…

匹配数字

这个简单

sed "/^[^0-9]/d" data2 > num

匹配邮箱

sed -n "/.@/p" data2 > mail

本来想匹配.com，主要一直不知道"."怎么处理，转义不行。网上暂时也找不到用简单正则方案能匹配的，所以貌似这里只能用grep的ERE?还望有人指点(如果有人看到的话…)
在这里插入图片描述
反正过了可还行…

参考答案

grep '^[0-9]' /home/shiyanlou/data2 > /home/shiyanlou/num
grep -E '^[a-zA-Z0-9_-]+@[a-zA-Z0-9_-]+(.[a-zA-Z0-9_-]+)+$' /home/shiyanlou/data2 > /home/shiyanlou/mail

猜你喜欢

转载自blog.csdn.net/weixin_43301333/article/details/114149598

实验楼--第十三章挑战

实验楼--第十三章_sed额外总结

实验楼--第十三章_正则基础

实验楼部分挑战

挑战：数据提取 — 实验楼

实验楼 - Python3挑战：类和Collection

实验楼python3学习挑战项目

Linux实验楼挑战备份日志

实验楼--第三章_文件权限

实验楼

实验楼-小时赛第1期 linux练习

【实验楼挑战】Python3简明教程：字符串挑战

实验楼linux教程

实验楼Linux笔记

实验楼----PHP大法

实验楼----奇妙的音乐

python类--实验楼

历史命令 — 实验楼

【实验楼】Django概览

【实验楼】Django运行

实验楼---玩转函数

实验楼linux测评

实验楼Python项目

模仿实验楼项目

Python3 挑战实验 -- 类和Collection(实验楼学习笔记)

【实验楼挑战】Python3简明教程：类和Collection模块

【实验楼挑战】Python3简明教程：玩转函数

实验楼机器学习挑战赛---python实现最小二乘法

实验楼机器学习挑战赛-----线性回归拟合并绘图

实验楼机器学习挑战赛-------最小二乘法 Python 实现

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)