// 1、过滤掉所有script脚本的正则: content.replaceAll("<script[^>]*?>[\\s\\S]*?<\\/script>", "") // 2、过滤掉所有style的正则: content.replaceAll("<[\\s]*?style[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?style[\\s]*?>", ""); // 滤掉所有html标签,保留p和br标签。 content.replaceAll("</?(?!br|/?p)[^>]*>", ""); // 4、指定字符串去重 content = content.replaceAll("(?s)(\r\n)(?=[\r|\n]*\\1)", ""); // 5、字符串去重 content = content.replaceAll("(?s)(.)(?=.*\\1)", ""); /* (?s) 开启单行模式 DOTALL 让. 号匹配任意字符 (.) 任意字符 并捕获在第一组 (?=.*\1) 这是断言, 表示后面内容将是 任意个字符加上第一组所捕获的内容 这样子,如果这整个式子匹配到,表示,第一个捕获组内容在字符串中,至少出现两次,替换为 "" 空串. */
正则表达式过滤
猜你喜欢
转载自ishejieye.iteye.com/blog/2283761
今日推荐
周排行