クリアHTMLタグC#方法

コードのHTMLタグの文字列を削除します。

パブリック 静的の 文字列 ClearHTMLTags1(文字列HTML)

        { 
            文字列 [] Regexs = {
                         @」の<script [^>] *?>。*?</ SCRIPT> " @" <(\ / \ sの*)?!?(( \ワット+:)\ W +)(\ワット+(\ S * = \ sの*(([ "" '])(\\ [ ""' tbnr] | [^ \ 7])* \ 7 | \??? 。{0})| | +)W?\ S)*(\ / \ S *)> " @" ([\ R \ N])\ S] + " @" QUOT(&|#34 ); " @" &(アンペア|#38); @ " &(LT |#60); ""@ ; |&(#62 GT)" @" &(NBSP |#160); " @" &(iexcl |#161); " @" &(セント|#162); " @ " &(ポンド|#163); " @」&(コピー|#169); " @" &#(\ D +); " @" - > " @"< - * \ nは!。"
        }。


            文字列 []はReplaces = {
                             "" "" "" " \" " "  " " < " " > " " " " \ XA1 // CHR(161)、 
                            // CHR(162)、
                            " \ XA3 "// CHR(163)、
                            " \ xa9 "// CHR(169)、
                            "" " \ R \ n " "" "" 
        }。


            文字列 S = HTML;
            以下のためにINT iは= 0 ; I <Regexs.Length; I ++ 
            { 
                S = 新しい正規表現(Regexs [i]は、RegexOptions.Multiline |RegexOptions.IgnoreCase).Replace(S代わる[I])。
            } 
            s.Replace(" < """ ); 
            s.Replace(" > """ ); 
            s.Replace(" \ R \ n """ );
            リターン秒; 
        }

 

おすすめ

転載: www.cnblogs.com/codedisco/p/12540647.html