Java—split函数

Java中的 split  函数是用于按指定字符(串)或正则去分割某个字符串,结果以字符串数组形式返回;

  下面是到例题, 这道题目是想我们去掉字符串s中多余的空格和标点符号;

String s = "cat dog,desk push last,   this is what.   must be";

String[] ss = s.split("\\s*\\,\\s*|\\s*\\.\\s*|\\s+");   //填空位置

//String[] string = s.split("\\s*\\p{Punct}\\s*|\\p{Space}+");   //第二种

for(String k: string) System.out.println(k);

第一种是找出s中存在的标点符号;而第二种是直接用正则表达式;

以下是代码的结果:

cat
dog
desk
push
last
this
is
what
must
be

  

java中提供了对正则表达式的支持,以下是一些正则表达式;

字符类
[abc] a、b 或 c(简单类)
[^abc] 任何字符,除了 a、b 或 c(否定)
[a-zA-Z] a 到 z 或 A 到 Z,两头的字母包括在内(范围)
[a-d[m-p]] a 到 d 或 m 到 p:[a-dm-p](并集)
[a-z&&[def]] d、e 或 f(交集)
[a-z&&[^bc]] a 到 z,除了 b 和 c:[ad-z](减去)
[a-z&&[^m-p]] a 到 z,而非 m 到 p:[a-lq-z](减去)
   
预定义字符类
\d 数字:[0-9]
\D 非数字: [^0-9]
\s 空白字符:[ \t\n\x0B\f\r]
\S 非空白字符:[^\s]
\w 单词字符:[a-zA-Z_0-9]
\W 非单词字符:[^\w]
   
POSIX 字符类(仅 US-ASCII)
\p{Lower} 小写字母字符:[a-z]
\p{Upper} 大写字母字符:[A-Z]
\p{ASCII} 所有 ASCII:[\x00-\x7F]
\p{Alpha} 字母字符:[\p{Lower}\p{Upper}]
\p{Digit} 十进制数字:[0-9]
\p{Alnum} 字母数字字符:[\p{Alpha}\p{Digit}]
\p{Punct} 标点符号:!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~
   

猜你喜欢

转载自blog.csdn.net/PI_PIBOY/article/details/83626485