지식의 정규 표현식 정렬

1)         개요

일반 식 (정규식) 문자열 (패턴)의 세트를 설명은 특정 기준에 맞는 서브 스트링 매칭을 대체하는 특정 문자열을 포함하는 문자열이 있는지 여부를 확인하기 위해 사용 또는 문자열로부터 제거 될 수있다 하위 문자열 등등.

이들 ( "메타 캐릭터"라 칭함) 일반적인 텍스트 문자 정규 표현 패턴 (Z에 들어 자) 및 특수 문자. 모드는 하나 이상의 문자열을 일치하는 텍스트 검색에 설명되어 있습니다. 템플릿으로 정규 표현식은 문자 패턴은 검색 문자열과 일치합니다.

2)   기본 문자 :( 문자 자체를 맞게 특수 문자는, 등) 이스케이프 문자 앞에 필요

(대괄호 [] 괄호의 역수로 나타내는 문자열이 일치하지 않는 알 수있는 경우를 제외하고) ^ 검색된 문자열의 시작 위치를 나타내는

$ 수단은 문자열의 끝 위치를 일치

* 경기를 제로로 여러 번 나타냅니다

+ (적어도 한번)이 복수 회에 매치를 나타낸다

? 0 또는 1 일치를 나타냅니다

즉 하나의 문자와 일치 나타냅니다 

| 두가을에,로 표현하거나

() 괄호는 괄호에있는 모든 문자와 일치 표시

[0-9 AZ AZ] 일치 괄호에 기재된 바와 같이 [] 괄호 문자 범위를 나타낸다

적어도 문자와 일치 나타낸다 {N} {N, N 일치 문자, N}으로 일치의 수를 정의하기위한 중괄호 {} {N, m}은 기껏 적어도 N m을 나타내고

\ 이스케이프 문자로 필요에 따라 기본 문자와 일치하는 이스케이프 문자는 \ * * 번호가 일치를 나타냅니다

\ W W 영숫자가 아닌 \ 문자와 숫자를 나타냅니다

\ D 숫자 \ D 비 디지털 나타낸다

 

3)   비 인쇄 문자

문자 설명

\ CX는 x로 지정된 제어 문자와 일치합니다. 예를 들어, \ CM은 Control-M 즉, 캐리지 리턴과 일치합니다. x 값은 AZ 또는 az해야합니다. 그렇지 않으면, 문자 'C'문자로 다.

\ 웹 사이트의 페이지에 대한 F 일치. \의 x0c와 \ (CL)에 해당합니다.

\ N 개행 일치한다. 등가는 X0A를 \와 CJ를 \합니다.

\ r 캐리지 리턴을 일치합니다. X0D 및 \ CM을 \에 해당합니다.

\ S는 공백, 탭, 페이지 나누기 등을 포함한 모든 공백 문자와 일치합니다. 동등 [\ F \ 없음 \ 연구 \ t \ V]. 전체 폭 공백 문자와 일치합니다 유니 코드 정규 표현식을합니다.

\ S는 공백이 아닌 문자와 일치합니다. 동등 [^ \ F \ 없음 \ 연구 \ t \ V].

\ T는 탭과 일치합니다. 등가는 X09 및 \ CI를 \합니다.

\ V는 수직 탭과 일치합니다. \의 X0B와 \의 CK에 해당합니다.

4)   규정

예선은 경기를 충족하기 위해 여러 번 나타나야 주어진 구성 요소의 정규 표현식을 지정하는 데 사용됩니다. 이 * 나 + 나? 아니면 육가지 {N} 또는 {N} 또는 {N, m} 총.

* 위의 표현식을 0 번 이상 일치합니다. 예를 들어, ZO * "z", "zoo"등. * {0}과 동등하다.

+ 위의 표현식을 한 번 이상 일치합니다. 예를 들어, "증"과 "동물원"일치 '+ zo 다음'하지만, "Z"를 일치하지 않을 수 있습니다. + {1}과 동등하다.

? 앞의 표현식 0 또는 1 일치합니다. 예를 들어, "(들)합니까?" "어떻게"일치은 "어떻게"의 "수행", "설"에서 "않습니다". ? {0,1}과 동일합니다.

{N} n은 음이 아닌 정수이다. 결정된 N 번 매칭. 예를 들어, 'o를 {2}'두 개의 오의 'O'만 일치 할 수있는 "음식"의 "밥"과 일치하지 않습니다.

{N} n은 음이 아닌 정수이다. 적어도 n 번에 일치. 예를 들어, 'o {2}'의 'O',하지만 모두 O를 일치시킬 수 있습니다 "foooood"의 "밥"과 일치하지 않습니다. 'O {1}'O '+'과 동등하다. 'O {0}'오 * '와 동등하다.

{N, m} m 및 n은 음수가 아닌 정수이다 여기서 n <= m. 매치와 최소 n 번에서 m 번까지 일치합니다. 예를 들어, "오 {1,3}"지난 3 O를 "fooooood"를 일치합니다. 'O {0,1}에 해당 O'? '. 유의하시기 바랍니다 쉼표와 두 숫자 사이의 공백이.

추천

출처www.cnblogs.com/newxu/p/11801552.html