复习NLP-实战(三)

一:Python中的正则表达式。

1.字符集合

[abc]指定包含字符、[a-zA-Z]来指定所有的英文字母的大小写

pattern = re.complie(r,'[a-zA-Z]');

re.findall(pattern,input)

2.正则表达式需要去记一些符号。可以去网上查找现成的,再去进行修改。

3.match和search,match从开头开始匹配,如果开头失败,就算失败了。

  search会跳过开头,继续查找合适的。

4.字符串的替换和修改

sub(rule,replace,target[,count])

subn(rule,replace,target[,count])

第一个参数是正则规则,第二个参数是指定的用来替换的字符串,第三个参数是目标字符串,第四个参数是最多替换次数。

5.split切片函数,使用指定的正则规则在目标字符串中查找匹配的字符串。

猜你喜欢

转载自www.cnblogs.com/maowuyu-xb/p/11389865.html