Jack Cole:
En mi Java 8 aplicación, estoy Análisis en busca de espacios en blanco en el texto se ha pasado. Pero \s
en mi expresión regular no captura todos los espacios en blanco. El espacio en blanco que uno he encontrado que no capta lo que va de mi prueba es para no romper Espacio (Unicode 00A0). Esta fue mi expresión regular que se estaba ejecutando en ese tema:
Pattern p = Pattern.compile("\\s");
Para solucionar esto, he añadido \h
a mi Expresión regular:
Pattern p = Pattern.compile("[\\s\\h]");
Ahora, ¿hay otros espacios en blanco que tengo que ser consciente de que no será capturado por \s\h
?
SDJ:
De acuerdo con el modelo de documentación de la clase de los caracteres que coinciden \s
son \t\n\x0B\f\r
.
Sin embargo, de hecho Unicode soporta un conjunto mucho más caracteres de espacio . Ejemplos incluyen:
\u2002
: En el espacio\u2003
: En el espacio\u2003
: Espacio delgado\u202F
Filtrar el espacio no-break