Konstrukte mit regulären Ausdrücken

Die regulären Ausdrücke, die bei der Suche und Segmentierung verwendet werden, entsprechen den von Java unterstützten Ausdrücken. Wenn Sie spezifischere Information benötigen, schauen Sie nach unter http://java.sun.com/j2se/1.4.2/docs/api/java/util/regex/Pattern.html.

Im Netz stehen einfache Einführungen zur Verfügung (z.B.http://www.regular-expressions.info/quickstart.html).


Das Konstrukt...

entspricht dem Folgenden:


Flaggen

(?i)

Erlaubt einen von der Groß-Kleinschreibung unabhängigen Vergleich (voreingestellt macht das Muster einen Unterschied zwischen Gross- und Kleinschreibung).


Zeichen

x

dem Zeichen x, es sei denn...

\uhhhh

Das Zeichen mit dem hexadezimalen Wert 0xhhhh

\t

Das Tab Zeichen ('\u0009')

\n

Das Absatz (newline-line feed) Zeichen '\u000A')

\r

Das Wagenrücklauf-Zeichen ('\u000D')

\f

Das Seitensprungzeichen ('\u000C')

\a

Das Klingelzeichen ('\u0007')

\e

Das Escapezeichen ('\u001B')

\cx

Das Kontrollzeichen entsprechend x

\0n

Das Zeichen mit dem Oktalwert 0n (0 <= n <= 7)

\0nn

Das Zeichen mit dem Oktalwert 0nn (0 <= n <= 7)

\0mnn

Das Zeichen mit dem Oktalwert 0mnn (0 <= m <= 3, 0 <= n <= 7)

\xhh

Das Zeichen mit dem hexadezimalen Wert 0xhh


das Anführungszeichen

\

tut nichts, als das nächste Zeichen zu zitieren. Das ist erforderlich, wenn Sie von den Meta-Zeichen !$()*+.<>?[\]^{|} als sich selbst entsprechend einfügen wollen.

\\

Das ist zum Beispiel der umgekehrte Schrägstrich

\Q

tut nichts als alle Zeichen bis zu \E zu zitieren.

\E

tut nichts als ein Zitat, das mit \Q begann, zu beenden


Klassen für die Unicode Blöcke und Kategorien

\p{InGreek}

Zeichen im Griechischen Block (einfacher Block)

\p{Lu}

Großbuchstabe (einfache Kategorie)

\p{Sc}

Währungssymbol

\p{InGreek}

Alle Zeichen nur nicht im Griechischen Block (Negation)

[\p{L}&&[^\p{Lu}]]

Alle Zeichen außer groß geschriebene Buchstaben (Subtraktion)


Zeichenklassen

[abc]

a, b, oder c(einfache Klasse)

[^abc]

Alle Zeichen a, b, oder c(Negation)

[a-zA-Z]

a bis z oder A bis Z, inklusive (Bereich)


Vorherbestimmte Zeichen-Klassen

.

Beliebiges Zeichen (außer Zeilenende)

\d

Eine Ziffer: [^0-9]

\d

Eine Nichtziffer: [^0-9]

\s

Leerzeichen (whitespace): [ \t\n\x0B\f\r]

\S

Ein Nichtziffer Zeichen [^\s]

\w

Ein Wortzeichen: [a-zA-Z_0-9]

\W

Ein Nichtwortzeichen:: [^\w]


Bereichstreffer

^

Anfang einer Zeile

$

Das Ende einer Zeile

\b

Eine Wortgrenze

\B

Eine Nichtwortgrenze


Gierige Quantifikatoren

Sie werden soviel als möglich zusammenfügen. Zum Beispiel,a+ wird aaa in aaabbb} entsprechen

X?

X, einmal oder nie

X*

X, kein- oder mehrmals

X+

X, ein- oder mehrmals


Widerwillige (nichtgierige) Quantifikatoren

Sie werden so wenig wie möglich einander gleichen. Zum Beispiel wird a+? dem ersten a in aaabbb entsprechen

X??

X, einmal oder nie

X*?

X, kein- oder mehrmals

X+?

X, ein- oder mehrmals


Logische Operatoren

XY

X gefolgt von Y

X|Y

Entweder X oder Y

(XY)

XY als einzige Gruppe



Rechtliche Hinweise Home Index des Inhalts