正则表达式过滤

// 1、过滤掉所有script脚本的正则:
content.replaceAll("<script[^>]*?>[\\s\\S]*?<\\/script>", "")

// 2、过滤掉所有style的正则:
 content.replaceAll("<[\\s]*?style[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?style[\\s]*?>", "");

// 滤掉所有html标签,保留p和br标签。
 content.replaceAll("</?(?!br|/?p)[^>]*>", "");

// 4、指定字符串去重 
   content = content.replaceAll("(?s)(\r\n)(?=[\r|\n]*\\1)", ""); 

// 5、字符串去重
   
   content = content.replaceAll("(?s)(.)(?=.*\\1)", ""); 
   
   /* (?s) 开启单行模式 DOTALL 让. 号匹配任意字符 
    (.) 任意字符 并捕获在第一组
    (?=.*\1) 这是断言, 表示后面内容将是 任意个字符加上第一组所捕获的内容 
    这样子,如果这整个式子匹配到,表示,第一个捕获组内容在字符串中,至少出现两次,替换为 "" 空串. */

猜你喜欢

转载自ishejieye.iteye.com/blog/2283761