用正则表达式进行匹配数据

正则表达式的介绍

前面允许用匹配、比较和通配符寻找数据。但随着过滤条件的复杂性增加,之前的过滤方法已经失效了。这就要用到更强大的匹配方法——正则表达式

正则表达式是用来匹配特殊的串(字符集合)。例如你想从一个文本中提取电话号码,就可以使用正则表达式。

所有种类的程序设计语言、文本编辑器、操作系统都支持正则表达式。它的应用很广法。与任意语言一样,正则表达式也具有语法

 

使用MySQL正则表达式 

前面已经说过了正则表达式是用来匹配文本的,将一个正则表达式和一个文本串进行比较。MySQL用WHERE子句对正则表达式提供了初步的支持,允许你指定正则表达式过滤SELECT检索出来的数据。当然MySQL仅仅支持正则表达式的一个子集,正则表达式实际上还有很多其他功能。

正则表达式的运用

  • 基本字符匹配 (检索列age包含文本20的所有行)
SELECT * FROM user WHERE age REGEXP '20'
  •  匹配任意字符(. 是一个正则表达式中一个特殊字符,它表示匹配任意一个字符)
SELECT * FROM user WHERE name REGEXP '.飞'
  • 进行OR匹配(使用正则表达式特殊字符 | 为搜索两个串之一,或者为这个串,或者为另一个串)
SELECT * FROM user WHERE age REGEXP '20|30'

  •  匹配几个字符串之一( [123]定义一组字符,它的意思是匹配1或2或3 ,也可以理解为 [1|2|3] )
  • []是另一种形式的OR
SELECT * FROM user WHERE name REGEXP '[123]小'

  •  匹配范围(为了简化[123456789] 这种类型的集合,则可以使用 - 来定义一个范围)
  • [1—9],另外也可以是字母范围[a—z]
SELECT * FROM user WHERE name REGEXP '[1-3]小'

  

  •  匹配特殊字符(正则表达式语言由特殊字符组成,如果需要匹配这些字符,则需要用到转义字符 \\)
  • 多数正则表达式使用但斜杠\转义特殊字符,但是MySQL要求使用两个
SELECT * FROM user WHERE name REGEXP '\\.'

  

  •  匹配字符类
  • 为了方便工作,可以使用预定义字符集(又称字符类),如下图

    

  •  匹配多个实例
  • 目前为止所有匹配的字符都是单次出现,如果想对匹配的数目控制,则需要用到重复元字符
元字符         说明
* 0个或多个匹配
+ 1个或多个匹配( 等与{1,} )
0个或1个匹配( 等于{0,1} )
{n} 指定数目的匹配
{n,0} 不少于指定数目的匹配
{n,m} 匹配数目的范围(m不超过255)

 

SELECT * FROM user WHERE name REGEXP 'ticks?'

  •  定位符(到目前为止所有匹配一个串都是任意位置的文本,为了匹配特定位置的文本,需使用定位符)
  • 例如你想找出以一个数或是小数点开始的所有内容
元字符 说明
^ 文本的开始位置
$ 文本的结束位置
[[:<:]] 词的开始
[[:>:]] 词的结束

         

SELECT * FROM user WHERE name REGEXP '^[0-9\\.]'

 

发布了138 篇原创文章 · 获赞 34 · 访问量 15万+

猜你喜欢

转载自blog.csdn.net/bbj12345678/article/details/105472944