Yo estoy procesando artículos de noticias de algunos canales RSS y quiero mostrar los titulares en mi aplicación web basada en Java.
Algunos de los alimentos tienen caracteres codificados en el título de ejemplo,
s viaje a Vitoria a & apos;; Arsenal y apos más difícil y apos; prueba de lazo Europea Liga inversa, advierte anfitriones & apos; entrenador
Puede haber otros caracteres codificados. Uso de Java (y sin tener que definir qué caracteres para buscar / reemplazar) ¿cómo puedo reemplazar todos los caracteres codificados para que pueda mostrar el título correctamente en la página web. p.ej
El viaje de Arsenal a Vitoria una prueba 'más difícil' de lazo Europa League inversa, advierte el entrenador anfitriones
Apache Commons Lang proporciona soporte para esto (org.apache.commons: Commons-lang3: 3,9):
Corriendo:
import org.apache.commons.lang.StringEscapeUtils;
public class Escape {
public static void main(String[] args) {
System.out.println(StringEscapeUtils.unescapeXml("Arsenal's trip to Vitoria a 'more difficult' test than reverse Europea League tie, warns hosts' coach"));
}
}
da como era de esperar:
El viaje de Arsenal a Vitoria una prueba 'más difícil' de lazo Europea Liga inversa, advierte el entrenador anfitriones