正则表达式的介绍
前面允许用匹配、比较和通配符寻找数据。但随着过滤条件的复杂性增加,之前的过滤方法已经失效了。这就要用到更强大的匹配方法——正则表达式
正则表达式是用来匹配特殊的串(字符集合)。例如你想从一个文本中提取电话号码,就可以使用正则表达式。
所有种类的程序设计语言、文本编辑器、操作系统都支持正则表达式。它的应用很广法。与任意语言一样,正则表达式也具有语法
使用MySQL正则表达式
前面已经说过了正则表达式是用来匹配文本的,将一个正则表达式和一个文本串进行比较。MySQL用WHERE子句对正则表达式提供了初步的支持,允许你指定正则表达式过滤SELECT检索出来的数据。当然MySQL仅仅支持正则表达式的一个子集,正则表达式实际上还有很多其他功能。
正则表达式的运用
- 基本字符匹配 (检索列age包含文本20的所有行)
SELECT * FROM user WHERE age REGEXP '20'
- 匹配任意字符(. 是一个正则表达式中一个特殊字符,它表示匹配任意一个字符)
SELECT * FROM user WHERE name REGEXP '.飞'
- 进行OR匹配(使用正则表达式特殊字符 | 为搜索两个串之一,或者为这个串,或者为另一个串)
SELECT * FROM user WHERE age REGEXP '20|30'
- 匹配几个字符串之一( [123]定义一组字符,它的意思是匹配1或2或3 ,也可以理解为 [1|2|3] )
- []是另一种形式的OR
SELECT * FROM user WHERE name REGEXP '[123]小'
- 匹配范围(为了简化[123456789] 这种类型的集合,则可以使用 - 来定义一个范围)
- [1—9],另外也可以是字母范围[a—z]
SELECT * FROM user WHERE name REGEXP '[1-3]小'
- 匹配特殊字符(正则表达式语言由特殊字符组成,如果需要匹配这些字符,则需要用到转义字符 \\)
- 多数正则表达式使用但斜杠\转义特殊字符,但是MySQL要求使用两个
SELECT * FROM user WHERE name REGEXP '\\.'
- 匹配字符类
- 为了方便工作,可以使用预定义字符集(又称字符类),如下图
- 匹配多个实例
- 目前为止所有匹配的字符都是单次出现,如果想对匹配的数目控制,则需要用到重复元字符
元字符 | 说明 |
* | 0个或多个匹配 |
+ | 1个或多个匹配( 等与{1,} ) |
? | 0个或1个匹配( 等于{0,1} ) |
{n} | 指定数目的匹配 |
{n,0} | 不少于指定数目的匹配 |
{n,m} | 匹配数目的范围(m不超过255) |
SELECT * FROM user WHERE name REGEXP 'ticks?'
- 定位符(到目前为止所有匹配一个串都是任意位置的文本,为了匹配特定位置的文本,需使用定位符)
- 例如你想找出以一个数或是小数点开始的所有内容
元字符 | 说明 |
^ | 文本的开始位置 |
$ | 文本的结束位置 |
[[:<:]] | 词的开始 |
[[:>:]] | 词的结束 |
SELECT * FROM user WHERE name REGEXP '^[0-9\\.]'