过滤html代码

  
    private static final String regEx_script = "<[\\s]*?script[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?script[\\s]*?>"; //定义script的正则表达式
    private static final String regEx_style = "<[\\s]*?style[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?style[\\s]*?>";//定义style的正则表达式
    private static final String regEx_html = "<[^>]+>"; // 定义HTML标签的正则表达式
    private static final String regEx_special = "\\&[a-zA-Z]{1,10};";//  定义一些特殊字符的正则表达式 如:     
    private static final String regEx_blank = "\\s*(\\r\\n|\\r|\\n|\\n\\r)\\s*";//定义回车换行符,以及前后的空白字符的正则表达式

    public static String rePlaceAllHtml(String str) {
        if(!StringUtil.isNullEmpty(str)){
            Pattern  p_html = Pattern.compile(regEx_script, Pattern.CASE_INSENSITIVE);
            Matcher m_html = p_html.matcher(str);
            str = m_html.replaceAll(""); // 过滤script

            p_html = Pattern.compile(regEx_style, Pattern.CASE_INSENSITIVE);
            m_html = p_html.matcher(str);
            str = m_html.replaceAll(""); // 过滤style

            p_html = Pattern.compile(regEx_html, Pattern.CASE_INSENSITIVE);
            m_html = p_html.matcher(str);
            str = m_html.replaceAll(""); // 过滤html标签

            p_html = Pattern.compile(regEx_special, Pattern.CASE_INSENSITIVE);
            m_html = p_html.matcher(str);
            str = m_html.replaceAll(""); // 过滤特殊字符
            return  str;
        }
        return "";
    }

    /**
     * 过滤html代码及回车换行
     * @param str
     * @return
     */
    public static String rePlaceAllHtmlAndBlank(String str){
        str = rePlaceAllHtml(str);//过滤html代码

        Pattern  p_html = Pattern.compile(regEx_blank, Pattern.CASE_INSENSITIVE);
        Matcher m_html = p_html.matcher(str);
        str = m_html.replaceAll(""); //过滤回车换行

        return str.trim(); //过滤前后的空白字符
    }

猜你喜欢

转载自blog.csdn.net/u012755196/article/details/80898068
今日推荐