所有换行匹配 -----------------------------干货(纯手打)

正则类:

[\s\D]*    匹配换行和空格

   今天想使用正则表达式来获取一段文本中的任意字符。

于是很随意得就写出如下匹配规则: (.*) 结果运行之后才发现,无法获得换行之后的文本。

于是查了一下手册,才发现正则表达式中,“.”(点符号)匹配的是除了换行符“\n”以外的所有字符。同时,手册上还有一句话:要匹配包括 '\n' 在内的任何字符,请使用像 '[.\n]' 的模式。

      于是我将正则表达式的匹配规则修改如下: ([.\n]*),当然,如果是在C#程序中直接写到话,需要改为([.\\n]*) 结果再次运行程序,发现什么内容也取不到了。

     我百思不得其解,又将其修改为如下规则: ([.|\n]*) 以及 (\n.]*) 结果还是不行,什么内容都取不到。看来点符号和换行符卯上劲了~ 然后上网一查,虽然没有查出上述规则到底是什么地方出问题了,但是查出了一个解决办法,经过一试,果然可以匹配包括换行符在内的任意字符,以下为正确的正则表达式匹配规则: ([\s\S]*) 同时,也可以用 “([\d\D]*)”、“([\w\W]*)” 来表示。

([\s\S]*?)  加上问号 表示最短匹配

 item['price'] = dd.re_first('¥(.*?)\s*</i>')


¥1.90/课时                        </i>

scrapy框架中CSS选择器:

comment_nums = response.css('.btn-bluet-bigger.href-style.hide-on-480::text').extract()[0].strip()

猜你喜欢

转载自blog.csdn.net/weixin_39664337/article/details/83747017
今日推荐