Reguläre Ausdrücke in Google Analytics und Urchin – Teil 2

Im ersten Teil der Reihe, „Reguläre Ausdrücke in Google Analytics und Urchin„, habe ich Ihnen einen kurzen Überblick über die in Google Analytics und Urchin verwendbaren regulären Ausdrücke gegeben. Dabei wurde auch die Verwendung der Metazeichen Punkt, Backslash, Bindestrich und eckige Klammern erläutert.

In diesem Teil zeige ich Ihnen, wie Sie die Quantifizierung, Gruppierung und Alternative einsetzen.

Quantifizierung

Um nun nicht immer wieder das Metazeichen für eine Suche wiederholt eingeben zu müssen, finden Sie bei den regulären Ausdrücken Funktionen zur Quantifizierung.

Metazeichen bei regulären Ausdrücken: Das FragezeichenFragezeichen

Das Fragezeichen entspricht der Anzahl 0 oder 1 des unmittelbar davor stehenden Zeichens.

Beispiel:

Der folgende reguläre Ausdruck

17und4?

entspricht somit unter anderem den Zeichenketten

17und

17und4

aber nicht den Zeichenketten

17und5

17undA

Warum? Der reguläre Ausdruck setzt voraus, dass in der Zeichenkette die Ziffer 4, die unmittelbar vor dem Fragezeichen steht, einmal oder gar nicht vorkommen darf.

Metazeichen bei regulären Ausdrücken: Das PluszeichenPluszeichen

Das Pluszeichen entspricht der Anzahl 1 oder mehr des davor stehenden Zeichens.

Beispiel:

Der folgende reguläre Ausdruck

17und4+

entspricht somit unter anderem den Zeichenketten

17und4

17und44

17und444

aber nicht den Zeichenketten

17und

17unda4

Warum? Der reguläre Ausdruck setzt voraus, dass in der Zeichenkette die Ziffer 4, die unmittelbar vor dem Pluszeichen steht, einmal oder mehrmals vorkommen muss.

Metazeichen bei regulären Ausdrücken: Der AsteriskAsterisk

Der Asterisk entspricht der Anzahl 0, 1 oder mehr des davor stehenden Zeichens.

Beispiel:

Der folgende reguläre Ausdruck

17und4*

entspricht somit unter anderem den Zeichenketten

17und

17und4

17und44

17und444

Warum? Der reguläre Ausdruck setzt voraus, dass in der Zeichenkette die Ziffer 4, die unmittelbar vor dem Asterisk steht, gar nicht, einmal oder mehrmals vorkommen darf.

Wiederholung

Metazeichen bei regulären Ausdrücken: Die geschweiften KlammernUm nun nicht immer wieder das Metazeichen für eine Suche wiederholt eingeben zu müssen, finden Sie bei den regulären Ausdrücken Funktionen zur Wiederholung. Diese werden mit der Syntax {minimum,maximum(opt.)} deklariert.

Beispiel 1:

Der folgende reguläre Ausdruck

17und4{2}

entspricht somit ausschließlich der Zeichenkette

17und44

aber nicht den Zeichenketten

17und

17und4

17und444

17unda4

Warum? Der reguläre Ausdruck setzt voraus, dass in der Zeichenkette die Ziffer 4, die unmittelbar vor der öffnenden geschweiften Klammer steht, exakt zweimal vorkommen muss.

Beispiel 2:

Der folgende reguläre Ausdruck

17und4{1,3}

entspricht somit ausschließlich den Zeichenketten

17und4

17und44

17und444

aber nicht den Zeichenketten

17und

17und4444

17unda4

Warum? Der reguläre Ausdruck setzt voraus, dass in der Zeichenkette die Ziffer 4, die unmittelbar vor der öffnenden geschweiften Klammer steht, mindestens einmal und höchstens dreimal vorkommen darf.

Gruppierung

Metazeichen bei regulären Ausdrücken: Die runden KlammernUm eine gefundene Zeichenkette für die spätere Verwendung zwischenspeichern zu können, finden Sie bei den regulären Ausdrücken die Funktion zur Gruppierung. Diese findet durch die Verwendung von runden Klammern statt.

Beispiel:

Der folgende reguläre Ausdruck

([gG]oogle, inc\.)

entspricht somit den Zeichenketten

google, inc.

Google, inc.

und würde das Suchergebnis zwischen den runden Klammern für die spätere Verwendung zwischenspeichern.

Alternative

Eine sehr hilfreiche Funktion innerhalb der regulären Ausdrücke ist die sogenannte Alternative. Die Syntax besteht aus dem Trennen mehrerer Alternativwerte durch ein Pipe-Symbol (|) und ist ganz einfach: wert1|wert2|wert3. Das würde dann bedeuten: Finde wert1 oder wert2 oder wert3.

Beispiel:

Der folgende reguläre Ausdruck

[gG]oogle, inc\.|[yY]ahoo, inc\.

entspricht somit den Zeichenketten

google, inc.

Google, inc.

yahoo, inc.

Yahoo, inc.

aber nicht den Zeichenketten

bing, inc.

Bing, inc.

Warum? Der reguläre Ausdruck setzt voraus, dass in der Zeichenkette die Zeichenfolge „Google, inc.“ oder „Yahoo, inc.“ enthalten sein muss. „Bing, inc.“ Ist keine Option. Dabei spielt es keine Rolle, ob der erst Buchstabe groß oder klein geschrieben wird.

Fortsetzung folgt…

Sie haben nun erfahren, wie Sie Quantifizierung, Gruppierung und Alternative einsetzen. Im dritten Teil dieser Reihe zeige ich Ihnen, wie Sie gezielt nach Zeichenketten am Anfang oder am Ende einer Zeile bzw. eines Feldes suchen können und welchen Vorteil Sie durch den Einsatz von Abkürzungen erfahren.

Kommentieren

Follow us:
Abonnieren Sie unseren Blog!
Folgen Sie uns auf Twitter!
Folgen Sie uns auf Facebook!
Folgen Sie uns auf LinkedIn!
Feedburner-Abo
RSS Feed für Reader abonnieren

oder geben Sie Ihre E-Mail-Adresse an:

Kategorien
Archive