RSSフィードエンコードされた文字を置き換えます

メカジキ :

私はいくつかのRSSフィードからのニュース記事を処理し、私のJavaベースのWebアプリケーション上の見出しを表示したいのです。

フィードのいくつかは、タイトルなどでエンコードされた文字を持っています

アーセナル 'は、ビトリアのA&APOSへの旅、より困難な'は、逆Europeaのリーグのネクタイよりもテストは、ホスト&APOSを警告しています。コーチ

他のエンコードされた文字があるかもしれません。使用したJava(および置換/検索する何文字を定義しなくても)私はウェブサイト上で正しくタイトルを表示することができますので、どのように私はすべてのエンコードされた文字を置き換えることができます。例えば

逆ヨーロッパリーグのネクタイよりも「より困難な」テストビトリアへのアーセナルの旅行は、ホストのコーチに警告します

ブノワ:

Apacheのコモンズラングこの(org.apache.commons:コモンズ-lang3:3.9)をサポートしています。

ランニング:

import org.apache.commons.lang.StringEscapeUtils;

public class Escape {

    public static void main(String[] args) {
        System.out.println(StringEscapeUtils.unescapeXml("Arsenal's trip to Vitoria a 'more difficult' test than reverse Europea League tie, warns hosts' coach"));
    }
}

予想通り提供します:

逆Europeaのリーグのネクタイよりも「より困難な」テストビトリアへのアーセナルの旅行は、ホストのコーチに警告します

おすすめ

転載: http://43.154.161.224:23101/article/api/json?id=363236&siteId=1