Original-Link: https: //blog.csdn.net/q77533005/article/details/83642725
Auszug:
STR = str.replaceAll ( "[\ pp ''" "]", "");
Unicode-Zeichencodierung ist nicht nur für eine einfache Definition eines Codes, aber es war auch klassifiziert.
\ PP Kleinbuchstaben p in dem die Eigenschaft gemeint ist Unicode-Eigenschaften für den Präfix Unicode reguläre Ausdrücke anzuzeigen.
Versalien P stellt eine der sieben Zeichenattribute Unicode-Zeichensatz: Satzzeichen.
Die anderen sechs sind
L: letters;
M: Markersymbol ( im allgemeinen nicht allein),
das Z: der Separator (wie Leerzeichen, Zeilenumbrüche, etc.);
S: Symbol (wie zum Beispiel mathematische Symbole, Währung, etc.);
N: Anzahl (wie beispielsweise arabische Ziffern, Roman digital, etc.);
C: andere Zeichen
Diese Eigenschaft ist vor sieben, sieben Attribute sowie mehrere Unterattribute für weitere teilter.
Java regulären Ausdruck Daten für Unicode Unicode wird von der Organisation zur Verfügung gestellt.
Unicode - Standard regulärer Ausdruck (kann in allen Untereigenschaften zu finden)
http://www.unicode.org/reports/tr18/
Die Definition der Unicode - Zeichenattribute können, haben wir einen Blick auf ein Zeichenattribut.
http://www.unicode.org/Public/UNIDATA/UnicodeData.txt
Dieses Textdokument ist eine Zeichenzeile, erste Spalte der Unicode - Codierung ist, die zweite Spalte ist der Name des Zeichens, und die dritte Spalte ist die Unicode - Eigenschaften,
sowie einige andere Zeicheninformationen.