\ T en realidad no capturar todos los espacios en blanco

Jack Cole:

En mi Java 8 aplicación, estoy Análisis en busca de espacios en blanco en el texto se ha pasado. Pero \sen mi expresión regular no captura todos los espacios en blanco. El espacio en blanco que uno he encontrado que no capta lo que va de mi prueba es para no romper Espacio (Unicode 00A0). Esta fue mi expresión regular que se estaba ejecutando en ese tema:

Pattern p = Pattern.compile("\\s");

Para solucionar esto, he añadido \ha mi Expresión regular:

Pattern p = Pattern.compile("[\\s\\h]");

Ahora, ¿hay otros espacios en blanco que tengo que ser consciente de que no será capturado por \s\h?

SDJ:

De acuerdo con el modelo de documentación de la clase de los caracteres que coinciden \sson \t\n\x0B\f\r.

Sin embargo, de hecho Unicode soporta un conjunto mucho más caracteres de espacio . Ejemplos incluyen:

  • \u2002: En el espacio
  • \u2003: En el espacio
  • \u2003: Espacio delgado
  • \u202FFiltrar el espacio no-break

Supongo que te gusta

Origin http://43.154.161.224:23101/article/api/json?id=226721&siteId=1
Recomendado
Clasificación