Les expressions regulars (o «regex») que podeu utilitzar en les cerques i en les regles de segmentació són les que permet el Java. Si necessiteu informació més específica, visiteu http://java.sun.com/j2se/1.5/docs/api/java/util/regex/Pattern.html. Vegeu a continuació informació de referència i exemples addicionals.
La construcció... |
...coincideix amb: |
Indicadors |
|
|
Fa que les cerques no distingeixin entre majúscules i minúscules (per defecte, es distingeix entre majúscules i minúscules). |
Caràcters |
|
|
El caràcter x, excepte els següents... |
|
El caràcter amb valor hexadecimal |
|
El caràcter de tabulació (« |
|
El caràcter de línia nova (salt de línia) (« |
|
El caràcter de retorn de carro (« |
\f |
El caràcter de salt de pàgina («\u000C») |
\a |
El caràcter d'avís sonor («\u0007») |
\e |
El caràcter d'escapada («\u001B») |
\cx |
El caràcter de control corresponent a x |
\0n |
El caràcter amb valor octal 0n (0 <= n <= 7) |
\0nn |
El caràcter amb valor octal 0nn (0 <= n <= 7) |
\0mnn |
El caràcter amb valor octal 0mnn (0 <= m <= 3, 0 <= n <= 7) |
\xhh |
El caràcter amb valor hexadecimal 0xhh |
Cita |
|
|
No res, però cita literalment el caràcter següent. És necessari si especifiqueu metacaràcters |
|
Per exemple, això representa el caràcter de barra inversa |
|
No res, però cita literalment tots els caràcters fins que s'especifiqui |
|
No res, però indica que acaba la cita literal iniciada per \Q |
Classes per a blocs i categories d'Unicode |
|
|
Un caràcter del bloc grec (bloc senzill) |
|
Una lletra en majúscules (categoria senzilla) |
|
Un símbol de moneda |
|
Qualsevol caràcter excepte algun del bloc grec (negació) |
|
Qualsevol lletra excepte una en majúscules (subtracció) |
Classes de caràcters |
|
|
|
|
Qualsevol caràcter excepte |
|
D' |
Classes de caràcters predefinides |
|
|
Qualsevol caràcter (excepte salts de línia) |
|
Un dígit: |
|
Qualsevol caràcter menys un dígit: |
|
Un caràcter d'espai en blanc: |
|
Qualsevol caràcter menys l'espai en blanc: |
|
Un caràcter de paraula: |
|
Qualsevol caràcter menys un caràcter de paraula: |
Caràcters de límit |
|
|
L'inici d'una línia |
|
El final d'una línia |
|
Un límit de paraula |
|
Qualsevol límit menys el de paraula |
Quantificadors «voraços» |
|
Coincideixen amb tants caràcters com sigui possible. Per exemple, |
|
X |
X, una vegada o cap |
X |
X, zero o més vegades |
X |
X, una o més vegades |
Quantificadors «no voraços» |
|
Coincideixen amb tan pocs caràcters com sigui possible. Per exemple, |
|
X |
X, una vegada o cap |
X |
X, zero o més vegades |
X |
X, una o més vegades |
Operadors lògics |
|
XY |
X seguida d'Y |
X |
X o bé Y |
|
XY com a un grup únic |
Expressió regular | Troba el següent: |
(\b\w+\b)\s\1\b |
paraules duplicades |
[\.,]\s*[\.,]+ | comes i punts mesclats |
\. \s$ | espais en blanc que sobren després del punt al final de la línia |
\s+a\s+[aeiou] | Anglès: paraules que comencen per vocals i que cal que vagin precedides per l'article «an», i no «a» |
\s+an\s+[^aeiou] | Anglès: igual que l'anterior, però per a consonants («a», i no «an») |
\s\s+ | més d'un espai |
\.[A-Z] | falta un espai entre un punt i el començament de la frase següent |
Avisos legals | Inici | Índex |