Urchin 6.6.02
Alle Artikel bezüglich Urchin 6.6.02
Alle Artikel bezüglich Urchin 6.6.02
Eventuell sind Ihnen die wenigen unter Microsoft Windows oder DOS verfügbaren Wildcards (* ? %) bekannt, mit deren Hilfe eingeschränkte Datei- bzw. SQL-Operationen durchgeführt werden können. Die sich hieraus ergebenden Möglichkeiten sind jedoch recht gering und erfordern weit mehr Flexibilität, wenn es darum geht, komplexe Datenbestände zu durchsuchen.
Aus diesem Grund nutzen Google Analytics und Urchin reguläre Ausdrücke. Damit werden auch umfangreiche Datenentsprechungen gefunden und ermöglichend zudem, gewünschte Aktionen auszuführen. Reguläre Ausdrücke können in Google Analytics bzw. Urchin wie folgt verwendet werden:
Doch dazu später mehr. Denn in diesem ersten Teil will ich Ihnen zunächst einen Überblick über die Notwendigkeit von regulären Ausdrücken vermitteln, sowie Sie mit den ersten beiden oft verwendeten Metazeichen bekannt machen.
Schauen Sie sich die folgende Tabelle einmal näher an. Sie werden bestimmt feststellen, dass es sich dabei um eine einfache Datenstruktur handelt.
Nr. | Artikel | Warengruppe | Farbe | Größe |
1 | T-Shirt | T-Shirt, Männer | grün | XL |
2 | T-Shirt | T-Shirt, Männer | gelb | L |
3 | T-Shirt | T-Shirt, Frauen | gelb-blau | XL |
4 | T-Shirt | T-Shirt, Frauen | blau | S |
5 | Sweatshirt | Sweatshirt, Männer | blau-rot | M |
6 | Sweatshirt | Sweatshirt, Frauen | rot | L |
Wenn Sie also aus dieser Tabelle die Datensätze selektieren sollen, deren Farbangabe den Kriterien „gelb“ und „gelb-blau“ entspricht, reichen die o.g. Kenntnisse völlig aus; Sie würden vermutlich nach „gelb*“ suchen und die Datensätze 2 und 3 als Ergebnis präsentiert bekommen.
Was nun aber, wenn die Aufgabestellung modifiziert wird und Sie alle Datensätze selektieren müssen, deren Farbangabe „gelb„, „rot“ und „blau-rot“ entspricht? Oder wenn zur Farbangabe noch die Größenangabe hinzukäme? Sie sehen, dieser Anforderung kann mit den vorgenannten Möglichkeiten nicht entsprochen werden.
Die Verwendung von regulären Ausdrücken (auch Regular Expressions oder RegEx genannt) ist nahezu unverzichtbar, wenn es darum geht aus großen Datenmengen bestimmte Entsprechungen herauszufinden.
Reguläre Ausdrücke dienen dazu, spezielle Zeichenketten in einer Menge von Zeichen bzw. Zeichenketten zu finden. Ein regulärer Ausdruck wird aus beliebigen Ziffern und Zeichen unter Berücksichtigung von Groß- und Kleinschreibung in Kombination mit folgenden Metazeichen gebildet:
Metazeichen | Kurzbeschreibung |
. | Beliebiges, einzelnes Zeichen |
\ | Wird benötigt, um ein Metazeichen buchstäblich zu nutzen |
[ ] | Gruppe von Zeichen |
– | Bereich (von-bis) |
? + * | Quantifizierung eines beliebigen Zeichens |
{ } | Wiederholung eines beliebigen Zeichens |
( ) | Gruppierung von Zeichen und Speicherung zur späteren Verwendung |
| | Deklaration alternativer Zeichenketten |
^ | Zeichen muss am Anfang stehen |
$ | Zeichen muss am Ende stehen |
\d | Abkürzung für Ziffern |
\w | Abkürzung für alphanumerische Zeichen bzw. Unterstrich |
\s | Abkürzung für Whitespaces |
Alle anderen Zeichen weisen keine Meta-Eigenschaft auf. Die Eigenschaften und Auswirkungen der Verwendung von Metazeichen – auch in Google Analytics und Urchin – zeige ich Ihnen in den nächsten Abschnitten und Teilen dieser Serie.
Der Punkt (.) ist eines der meistgenutzten Metazeichen und entspricht einem beliebigen, einzelnen Zeichen. Die Betonung liegt hier tatsächlich auf beliebig und einzeln, denn ganz gleich, welches Zeichen der Zeichenkette gefunden werden soll, durch den Punkt sind alle denkbaren Zeichen abgedeckt.
Beispiel:
Der folgende reguläre Ausdruck
Akt ., Szene 3
entspricht somit den Zeichenketten
Akt 1, Szene 3
Akt 2, Szene 3
Akt 3, Szene 3
Akt 4, Szene 3
Akt 5, Szene 3
Akt 6, Szene 3
Akt 7, Szene 3
Akt 8, Szene 3
Akt 9, Szene 3
nicht aber der Zeichenkette
Akt 10, Szene 3
Warum? Die Zeichen „10“ stellen mehr als ein Zeichen dar. Sie erinnern sich? Die Betonung liegt bei der Verwendung des Metazeichens Punkt auf „einzelnes Zeichen„.
Um dieser Zeichenkette zu entsprechen, müsste der reguläre Ausdruck wie folgt modifiziert werden:
Akt .., Szene 3
Der Backslash (\) wird dazu verwendet, einem Metazeichen buchstäblich zu entsprechen.
Beispiel:
Der folgende reguläre Ausdruck
z.B. Blumen
entspricht somit der Zeichenkette
z.B. Blumen
aber auch den Zeichenketten
zUB. Blumen
z.B3 Blumen
z1Bg Blumen
Warum? Zur Erinnerung: Ein Punkt (.) entspricht einem beliebigen, einzelnen Zeichen. Um einem Punkt buchstäblich zu entsprechen, muss diesem somit ein Backslash (\) vorangestellt werden.
Der folgende reguläre Ausdruck
z\.B\. Blumen
entspricht nun ausschließlich der Zeichenkette „z.B. Blumen“, da nach dem Punkt durch den vorangestellten Backslash buchstäblich gesucht wird.
Oftmals besteht die Notwendigkeit, nach verschiedenen Zeichen in einer Zeichenkette parallel zu suchen. So wäre in Bezug auf das Beispiel aus der Einführung denkbar, dass Sie die Datensätze der Größen S und M gleichzeitig suchen.
Um das zu realisieren, werden bei den regulären Ausdrücken die eckigen Klammern ([ ]) genutzt.
Alle Zeichen, die innerhalb der eckigen Klammern stehen, werden an der jeweiligen Stelle gesucht und gefunden.
Beispiel:
Der folgende reguläre Ausdruck
[zZ]\.[bB]\. Blumen
entspricht somit den Zeichenketten
z.B. Blumen
Z.B. Blumen
z.b. Blumen
Z.b. Blumen
nicht aber den Zeichenketten
z.B. blumen
ZB Blumen
Warum? Der reguläre Ausdruck setzt zum einen voraus, dass in der Zeichenkette das Wort „Blumen“ mit einem „B“ als Großbuchstabe enthält und zum anderen nach „z“ und „b“ jeweils ein Punkt steht.
Durch den Einsatz eines Bindestrichs (–) innerhalb der eckigen Klammern, können Sie Bereiche definieren, nach denen gesucht werden soll.
Beispiel:
Der folgende reguläre Ausdruck
Marktplatz [0–9]
entspricht somit unter anderem den Zeichenketten
Marktplatz 1
Marktplatz 5
Marktplatz 9
aber nicht den Zeichenketten
Marktplatz 37
Marktplatz A
Warum? Der reguläre Ausdruck setzt zum einen voraus, dass die Zeichenkette nur ein Zeichen der Ziffern zwischen 1 und 9 enthält und zum zweiten keine Buchstaben enthalten darf.
Durch den Einsatz des Caret (^) direkt nach der öffnenden eckigen Klammer werden die gesuchten Entsprechungen invertiert.
Der reguläre Ausdruck für eine Gruppe [^zZbB] entspricht allen Zeichen, die nicht ein z, Z, b oder B darstellen.
Ebenso verhält es sich mit Bereichen. Der reguläre Ausdruck [^0–9] entspricht allen Zeichen, die nicht 0, 1, 2, 3, 4, 5, 6, 7, 8 oder 9 darstellen.
In diesem ersten Teil haben Sie einen Überbick die in Google Analytics und Urchin verwendbaren regulären Ausdrücke erhalten. Ebenso haben Sie mehr über die Verwendung der Metazeichen Punkt, Backslash, Bindestrich und eckige Klammern erfahren. Im zweiten Teil dieser Reihe gehe ich auf die Möglichkeiten ein, die sich durch den Einsatz von Quantifizierung, Gruppierung und Alternative bieten.
Nachdem die aktuelle Version 7 der beliebten Software Urchin from Google veröffentlicht wurde, ist die Weiterentwicklung der Version 6 (letztes Release 6.6.03) eingestellt worden. Damit einher geht nun auch die Tatsache, dass aktuelle Betriebssysteme wie z. B. Windows 7 von Microsoft nicht mehr identifiziert und somit automatisch dem ältesten Vorgänger hinzugerechnet werden.
Jan-Martin Lurse von der Firma excentos GmbH zeigt in diesem Gastbeitrag auf, wie Sie mit geeigneter Filtersetzung die neuen Betriebssysteme in Urchin 6 doch erfassen können.
Damit Sie das Betriebssystem (Windows) korrekt identifizieren können, ist in Urchin 6 ein Filter nötig, der den User Agent ausliest und dann die Plattform Version entsprechend ersetzt. Das erreichen Sie am besten mit einem Filter des Typs „Erweitert“:
Nun weisen Sie den Filter den gewünschten Profilen bzw. Protokollquellen zu und verarbeiten Ihre Profile wie gehabt.
Wies Urchin im Bericht „Plattformen“ noch exorbitant hohe Ergebnisse für das Betriebssystem „NT“ aus (welch ein Revival!), folgt die Ernüchterung nach Zuweisen des Filters auf dem Fuß.
Vorher:
Nachher:
Hiermit wird deutlich, dass Sie Urchin 6 mit dem richtigen Know-How auch künftig nutzen können und durch geeignete Filtersetzung die Informationen erhalten, die Sie benötigen.
Dass Online-Kampagnen mit Google Analytics und Urchin Software hervorragend ausgewertet werden können, sollte mittlerweile hinlänglich bekannt sein. Wie aber sieht es mit Kampagnen im „Offline“-Bereich aus? Zeitungen, Zeitschriften, Radio- oder Fernseh-Spots? Wäre es denn nicht schön, wenn auch diese Kampagnen mit den Analysetools aus dem Hause Google messbar wären? Sie denken, das geht nicht? Schön! Denn gerne zeige ich Ihnen einen möglichen Weg auf, wie es doch geht…
Gerade bei Anzeigen in Printmedien, Radio- oder TV-Spots wird doch immer öfter auf eine Interetseite verwiesen. Da dieser URL nicht zu lang sein darf (schließlich will der Werbende ja, dass sich die Zielperson/-gruppe diesen auch merkt), wird meist auf die Startseite, maximal jedoch auf eine leicht zu merkende Unterseite verwiesen.
Auf der Startseite wird dann versucht, den Besucher (und potenziellen Kunden) mit einem Eye-Catcher „abzuholen“ (meist auffälliger Button, der den Slogan der Kampagne widerspiegelt) und mittels Klick auf die gewünschte Unterseite zu lenken. Großer Fehler! Denn auf der Startseite einer Website tummeln sich mitunter viele Aktionselemente (sog. Call-to-Action), die um die (Klick-)Gunst des Besuchers buhlen.
Werbung für ALICE DSL (zu sehen auf http://myg8.de/alice-dsl) im TV führt bei Eingabe des kommunizieren URL (www.alice.de) auf die Startseite des Unternehmens, auf der sich alleine acht Aktionselemente aneinanderreihen (die Buttons im unteren Bereich eines jeden Kästchens):
Somit kann es auch gerne mal passieren, dass der Besucher eben nicht auf das gewünschte Aktionselement klickt, weil er es nicht auf anhieb findet, sich auf der Website einfach nicht „wohlfühlt“ oder aber schlichtweg ein anderes „Klick MICH!“-brüllendes Aktionselement wählt.
Den Vogel aber in Sachen Nutzerfrustration schießt in der Tat die Firma Nivea mit ihrem TV-Spot „NIVEA FOR MEN Revitalising Q10 Gel“ ab (zu sehen unter http://myg8.de/n4m-horizont oder auch unter http://myg8.de/n4m-myvideo). In diesem Werbeclip wird ab der fünften Sekunde deutlich sichtbar der URL www.niveaformen.de eingeblendet. In dem ganzen Spot geht es um die „revitalisierende Wirkung“ des Produkts mit dem Namen „Q10“.
Spannend aber in diesem Zusammenhang ist, dass eben dieser URL weder zu den Produktdetails führt noch auf der Startseite überhaupt ein sofort sichtbares Aktionselement auf das Produkt hinweist. Vielmehr wird der Besucher mit dem kompletten Produktportfolio der Firma „überrannt“.
Dort müsste er sich erst mühsam zum Produkt durchklicken und dann im Nivea-Shop wieder ganz bei Null anfangen, da auf der Produktseite weder ein Link auf die Produktdetails im Shop existiert noch eine Warenkorbfunktion verfügbar ist.
Wenn wir nun einmal annehmen, wir würden ein KFZ des fiktiven Automobilherstellers „PAX Automobile GmbH“ bewerben wollen. Das Ziel der Kampagne ist es, möglichst viele Menschen dazu zu bewegen, einen Termin für eine Probefahrt über die Website des Herstellers (www.pax-automobile.de) zu vereinbaren.
Diese Kampagne würde im über einen Monat verteilt in den unterschiedlichsten Medien geschaltet werden:
Bereits in der Einlietung erwähnte ich, dass die Auswertung von Online-Kampagnen kein Problem ist, da wir hier ohne große Mühen eine entsprechende Kampagnenkennzeichnung durchführen können. Wie wir aber den Online-Erfolg durch die Bewerbung des Produkts in einem Offline-Medium messen können, erläutere ich in den folgenden Abschnitten.
Wie also kann nun die Internet-Reaktion auf einen solchen TV-Spot ausgewertet werden? Was genau brauchen Sie nun, um Offline-Kampagnen messen zu können? Die Antwort auf die Fragen lautet: Kampagnen-Variablen in Kombination mit einem URL-Shortening-Service und ggf. einer weiteren Domain…
Ggf. benötigen Sie, wie bereits erwähnt, eine weitere Domain und zusätzlichen Webspace (haben Sie entweder oder können ihn bei ihrem Providern für wenige Euros erhalten). Die Sache mit der Domain hingegen ist nicht ganz so trivial: sie sollte
Ja, ich weiß, das ist nicht leicht. Nachfolgend ein paar Beispiele, wie das funktionieren könnte:
Hauptdomain | zweite Domain |
hewlett-packard.de | hp.de |
volkswagen.de | vw.de |
niveaformen.de | n4m.de |
Dieser Schritt ist aber in der Tat optional. Eventuell finden Sie partout kein passendes Pendant zu Ihrer bestehenden Domain oder aber es sind alle sinnvollen kurzen Domainnamen bereits vergriffen. Sofern Ihre Domain nicht aus einer langen Zeichenkette (herzlich-willkommen-in-meinem-webspace.com) oder einer „sinnlosen“ Aneinanderreihung von Zeichen (lgrzf1.biz) besteht, können Sie aber trotzdem die hier beschriebenen Techniken anwenden, selbst wenn Sie sich keine zweite Domain zulegen.
Sie erinnern sich? Da war doch was von wegen Kampagnenvariablen an den URL anhängen…? Richtig! Hier noch einmnal zur Auffrischung der Kenntnisse: Von den in Summe fünf existierenden Kampagnenvariablen bei Google sind drei obligatorisch (utm_source, utm_medium, utm_campaing) und zwei optional (utm_content, utm_term). In der nachstehenden Tabelle finden Sie (auch nur zur Auffrischung) noch einmal die Bedeutung der einzelnen Variablen:
Variable | Bedeutung | obligatorisch |
utm_source | Identifiziert den Vermittler bzw. die verweisende Quelle (google, Stadtsuche, newsletter4) -> Woher kommt der Besucher? | ja |
utm_medium | Werbe- bzw. Marketingmedium (z. B. CPC, Banner, E-Mail) | ja |
utm_campagain | Name der Kampagne (z. B. Schlussverkauf, Frühbucher oder aber auch Produkt, Promo-Code, Slogan) | ja |
utm_content | Aussagekräftige Beschreibung, mit denen verschiedene Anzeigeversionen zum Vergleich (A/B-Test) identifiziert werden können (z. B. Text_rot, Text_blau) | nein |
utm_term | Keyword, nach dem gesucht wurde – bezahlt und unbezahlt (z. B. Hemd, Wasser+Flasche) | nein |
Wenn Sie sich also Gedanken zu den einzelnen Variablen gemacht haben und diese dann mit Leben füllen wollen, fügen Sie diese einfach an das Ende des URL an. Das würde dann etwa so aussehen:
http://www.domain.com/?utm_source=newsletter&utm_medium=email&utm_campaign=neue_produkte
Und damit Sie bei der Erstellung des URL keinen Fehler machen, hat Google natürlich ein entsprechendes Online-Tool zur Verfügung gestellt: den URL-Builder (zu finden unter http://myg8.de/url-tool).
Damit wären ja eigentlich alle Probleme gelöst, nicht wahr? Also könnte doch auch Nivea, um bei diesem Beispiel zu bleiben, einen sogenannten Deeplink (Link zur Produktdetailseite) mit diesen Kampagnenvariablen kommunizieren und schon wäre der potenzielle Kunde a) auf der richtigen Seite und b) könnten die Website-Betreiber eine Auswertung der Kampagne durchführen, richtig?
Falsch! Wer, bitte, ist in der Lage sich einen URL wie den folgenden in der kurzen Zeit eines Werbespots zu merken:
URLs, die auf Unterseiten Ihrer Internetpräsenz verweisen, können – je nach Struktur Ihrer Website – eine große Anzahl an Zeichen enthalten. Gerade bei Blogs (domain/jahr/monat/tag/blog-titel) und auchbei modernen Shop-Systemen (domain/warengruppe/kategorie/produktseite) ist das sehr oft der Fall.
Sofern Sie Twitter, LinkedIn, Facebook, etc. nutzen, wissen Sie, dass gerade bei den Statusmeldungen nur eine begrenzte Anzahl Zeichen erlaubt sind (ähnlich wie beim Schreiben einer SMS). Um nun hier mittels Link auf eine Webseite hinzuweisen und dafür möglichst wenige Zeichen zu „verschwenden“ haben sich in den letzten Jahren sogenannte URL-Shortening-Services etabliert (z. B. bit.ly, tinyurl.com, cli.gs, goo.gl, etc). Wie diese funktionieren und welchen Stellenwert sie im Bereich Social Media einnehmen, habe ich in meinem Blog-Post „URL-Shortening-Services für Social Media Marketing“ erläutert.
Diese Dienste verwandeln nun einen langen URL in einen völlig anderen, aber dafür kürzeren URL. So wird beispielsweise aus der langen Zeichenkette http://www.meine-domain.de/verzeichnis/unterseite/detail der folgende kurze URL http://bit.ly/abc.
Der Nachteil aber ist, dass Sie hier zum einen auf einen externen Dienstleister angewiesen sind und zum anderen den gekürzten URL nicht immer beeinflussen können. Daher empfehle ich den Einsatz eines eigenen URL-Shortening-Services.
Das Tool meiner Wahl, welches auch bei uns verwendet wird, lautet Pretty Link Pro für WordPress und ist in einer kostenfreien sowie einer kostenpflichtigen Version erhältlich. Damit stellen Sie sicher, dass Sie die volle Kontrolle über Ihre gekürzten Links und die verwendete Domain haben. Um dieses Tool einsetzen zu können, benötigen Sie lediglich eine Domain (entweder eine zweite oder aber die bestehende ohne „www“ davor), etwas freien Webspace und eine Installation von WordPress (kostenfrei zu beziehen auf wordpress.org). Die Installation von WordPress und Pretty Link Pro ist ziemlich einfach und in ca. 15 Minuten abgeschlossen.
Nachdem Sie sich nun alle „Zutaten“ besorgt haben, geht es an die Umsetzung des Vorhabens. Dabei beziehe ich mich wieder auf die oben genannte Beispielkampagne.
Der erste Schrit ist nun, für unsere Beispielkampagne eine zweite URL zu registrierten (z. B. paxcar.de), einen Webserver zu starten und WordPress zu installieren.
In WordPress wird dann der zuvor erwähnte URL-Shortening-Service Pretty Link Pro installiert und aktiviert.
Jetzt erstellen wir uns eine Tabelle nach folgendem Schema und füllen diese dann mit den gewünschten Werten:
Kampagne | Werbeträger | Werbemittel | Version | Landeseite |
PAX-2010 jetzt probefahren | Tageszeitung | Zeitung | TZ-37/2011 | http://www.pax-automobile.de/pax-2010/probefahrt/ |
PAX-2010 jetzt probefahren | Tageszeitung | Zeitung | TZ-44/2011 | http://www.pax-automobile.de/pax-2010/probefahrt/ |
PAX-2010 jetzt probefahren | Tageszeitung | Zeitung | TZ-51/2011 | http://www.pax-automobile.de/pax-2010/probefahrt/ |
PAX-2010 jetzt probefahren | Tageszeitung | Zeitung | TZ-58/2011 | http://www.pax-automobile.de/pax-2010/probefahrt/ |
PAX-2010 jetzt probefahren | SWR | Radio | SWR-Radio-Spot | http://www.pax-automobile.de/pax-2010/probefahrt/ |
PAX-2010 jetzt probefahren | RTL | Radio | RTL-Radio-Spot | http://www.pax-automobile.de/pax-2010/probefahrt/ |
PAX-2010 jetzt probefahren | SAT1 | TV | SAT1-TV-Spot | http://www.pax-automobile.de/pax-2010/probefahrt/ |
PAX-2010 jetzt probefahren | RTL | TV | RTL-TV-Spot | http://www.pax-automobile.de/pax-2010/probefahrt/ |
Um Ihnen die Arbeit zu erleichtern, habe ich eine Excel-Datei angefertigt, die Ihnen dabei hilft, die Kampagnen-URLs zu generieren. Sie können sich die Tabelle zur Planung von Offline-Kampagnen hier herunterladen.
Wir nutzen das Google Tool zur URL-Erstellung (http://myg8.de/url-tool), um die in Schritt 3 erfassten Werte in Kampagnenvariablen umzuwandeln:
Im fünften und letzten Schritt kürzen wir nun in unserem URL-Shortener den langen, mit Kampagnenvariablen gekennzeichneten URL und vergeben dabei sinnvolle Namen:
Sobald alle Kampagnenlinks erfasst wurden, können wir die gekürzten URLs an die Werbeträger kommunizieren bzw. integrieren.
Nachdem die URLs über die diversen Werbemedien an die potenziellen Kunden kommuniziert wurden, können wir den Erfolg der Kampagne wunderbar in Google Analytics bzw. Urchin nachverfolgen:
Durch die Sichtbarkeit der Offline-Kampagnen in Ihrer Webanalyselösung ist es nun auch möglich, die entsprechenden Conversion-Pfade zu definieren, zu messen und zu optimieren. Noch Fragen? Einfach Kommentar posten oder mit uns Kontaktaufnehmen :-).
Wichtige Meldung für alle Nutzer von Urchin Version 6: Mit Wirkung zum 31.01.2011 wird die Google AdWords NetAPI v1.3 abgeschaltet. Somit ist der Zugriff auf das AdWords-Backend mit dieser API nicht mehr möglich.
Davon betroffen sind Nutzer der Urchin-Versionen 6.5.00 bis 6.6.02, die Ihre AdWords-Kampagnen mit Urchin auswerten. Wir raten daher dringend an, Urchin kostenfrei auf die Version 6.6.03 zu aktualisieren oder aber ein Update auf die aktuelle Version 7.0.00 zu erwerben.
Für all diejenigen Nutzer, die mit Urchin keine AdWords-Kampagnen auswerten, ändert sich primär nichts.
Mitunter bringt das eine oder andere Profil die beteiligten Urchin-Prozesse während der Verarbeitung zum Absturz. Wenn das vorkommt, können die nachfolgenden Einträge in der Warteschlange nicht mehr verarbeitet werden, da Urchin die sequenzielle Abarbeitungsreihenfolge strikt einhält. Unglücklicherweise hilft hier auch kein Systemneustart, da sich eben genau dieser Eintrag hartnäckig in der Datenbank hält, immer wieder in der Warteschlange auftaucht und Urchin davon abhält, die Profile weiter zu verarbeiten.
Wie Sie aus dem unten abgebildeten Screenshot des Urchin Schedulers erkennen können, „hängt“ der Verarbeitungsprozess für das Profil „www.webalytics.de“ und alle weiteren Profile können daher nicht verarbeitet werden. Auch wird die Problematik durch die Warnung, Master- und Slave-Scheduler seien beide deaktiviert.
Es ist somit nötig, diesen Eintrag manuell aus der entsprechenden Tabelle der Urchin-Datenbank zu entfernen. Dieser Vorgang ist ausschließlich Mithilfe der Kommandozeile möglich. Um diese Störung zu beheben, werden zwei Szenarien unterschieden:
Handelt es sich bei dem störenden Eintrag um ein regelmäßig zu verarbeitendes Profil, ist die vorherige Deaktivierung des dem Profil zugeorneten Aufgabenplaners empfohlen. Danach melden Sie sich per Kommandozeile an der Datenbank an. Kommt bei Ihnen eine MySQL-Datenbank zum Einsatz, geben Sie dazu den folgenden Befehl ein:
mysql –p –u <username> <urchin database>
Ersetzen Sie dabei bitte <username> und <urchin database> durch die passenden Angaben Ihres Systems.
Möchten Sie alle Warteschlangen-Einträge entfernen, geben Sie folgenden Befehl ein:
DELETE FROM uprofiles_queue;
In diesem Fall müssen Sie zunächst einmal die ID des betroffenen Profils ermitteln. Dies geschieht mit folgendem Befehl:
SELECT uspr_id,ucpr_name FROM uprofiles WHERE ucpr_name LIKE '%<Search String>%';
Dabei steht <Search String> für einen beliebigen Teil des Profilnamens, den Sie aus der Warteschlange entfernen wollen. In unserem Beispiel würde bereits der Search String „webalytics“ ausreichen, um folgende Ausgabe an der Kommandozeile zu erhalten:
mysql> SELECT uspr_id,ucpr_name FROM uprofiles WHERE ucpr_name LIKE '%webalytics%'; +---------+--------------------+ | uspr_id | ucpr_name | +---------+--------------------+ | 3 | www.webalytics.de | | 4 | webalytics.de | +---------+--------------------+ 2 rows in set (0.00 sec)
Mihilfe des folgenden Befehls wird dann der entsprechende Eintrag in der Queue gelöscht:
DELETE FROM uprofiles_queue WHERE uspr_id=<Search Result>;
Ersetzen Sie bitte <Search Result> durch die ID aus der ersten Spalte der Ergebnisliste, die dem zu löschenden Eintrag entspricht. Da in unserem Beispiel (siehe Abbildung oben) das Profil „www.webalytcs.de“ stockt, müsste nun korrekterweise die ID 3 gelöscht werden.
Nachdem das blockierende Profil erfolgreich aus der Warteschlage entfernt wurde, verlassen Sie die Datenbank und MySQL-Kommandozeile mit dem Befehl exit.
Abschließend muss nun noch sichgestellt werden, dass alle erforderlichen Urchin-Dienste wieder ausgeführt werden. Dazu wird auf der Kommandozeile im Urchin-Verzeichnis folgender Befehl eingegeben:
./bin/urchinctl restart
(wenn Urchin per HTTP erreichbar sein soll) oder
./bin/urchinctl –e restart
(wenn Urchin per HTTPS erreichbar sein soll)
Bitte beachten Sie: Die folgende Anleitung wurde nur mit dem Betriebssystem CentOS 5.5 getestet.
In unserem Blogeintrag Urchin 6.6.02 installieren haben wir bereits beschrieben, wie man Urchin auf einem Linux-System fachgerecht installiert. Heute möchte ich das von uns erstellte Daemon-Script vorstellen.
Der Vorteil dieses Scripts ist, dass nach jedem Neustart des Servers Urchin auch automatisch gestartet wird. Bei der Installation von Urchin wird ein sogenanntes Urchin-Startscript erstellt. Das Script trägt den Namen „urchin_daemons“ und befindet sich im Verzeichnis /path-to-urchin/util. Doch zunächst müssen noch einige Voraussetzungen erfüllt sein, damit die Installation dieses Daemon-Scripts erfolgreich durchgeführt werden kann.
Wie Sie schon erfahren haben, wird nach einem Serverneustart die MySQL-Datenbank und Urchin ohne weitere Eingriffe nicht neu gestartet. Um sicherzustellen, dass Urchin nach dem Neustart eines Servers auch automatisiert neu gestartet wird haben wir ein Installationsscript für das Urchin-Startscript entwickelt. Des Weiteren wird beschrieben wie sich MySQL auch automatisch starten lässt.
Es wird vorausgesetzt, dass MySQL installiert und eine Datenbank für Urchin angelegt ist. Wenn dies noch nicht geschehen ist, dann verfahren Sie bitte, wie unserem Blogeintrag Urchin 6.6.02 installieren beschrieben.
Als Erstes muss sicher gestellt werden, dass MySQL beim Start des Betriebssystems automatisch mit gestartet wird. Das Installationsscript für das Urchin-Startscript wird zwar fehlerfrei ausgeführt, es muss aber auch sichergestellt werden, dass MySQL bei einem Neustart des Betriebssystems vor Urchin gestartet und ausgeführt wird.
Mit folgendem Befehl, den Sie in die Shell des Betriebssystems z.B die Bash eingeben, wird angezeigt, ob MySQL nach einem Neustart des Betriebssystems automatisch ausgeführt wird:
/sbin/chkconfig --list | grep mysql
Sind bei Runlevel 3 und 5, wie in der Abbildung angezeigt auf, die Werte auf „off“ gesetzt, so müssen diese auf „on“ umgestellt werden. Sind diese bereits auf „on“ gesetzt, überspringen Sie bitte den nächsten Schritt. Mit der Eingabe des folgenden Befehls startet MySQL automatisch nach jedem Neustart:
/sbin/chkconfig --level 35 mysqld on
Mit folgendem Befehl können Sie überprüfen, ob die Eingabe des vorherigen Befehls ordungsgemäß ausgeführt worden ist.
/sbin/chkconfig --list | grep mysql
Haben Sie alle beschriebenen Schritte ausgeführt, können Sie das eigentliche Installationsscript ausführen, welches Sie sich hier herunterladen können: http://myg8.de/urchin-daemons (zip-Datei)
Speichern Sie das Installationsscript am besten im Ordner „/tmp“ ab. Im Folgenden wird beschrieben, mit welchen Parametern Sie das Installationsscript ausführen können. Der Befehl hierfür lautet:
/install_urchin_daemons.sh --help a: Gibt eine Liste aller installierten Dienste aus d: Deaktiviert das Urchin Startup-Script e: Aktiviert das Urchin Startup-Script h: Gibt diese Hilfe-Informationen aus l: Gibt eine Liste der installierten Dienste mit Run Level 3,5 aus
Mit diesem Befehl führen Sie das Installationsscript aus:
./install_urchin_daemons.sh
Nach der Ausführung werden Sie gefragt, ob Sie das Startscript installieren möchten. Bitte bestätigen Sie, indem Sie „2“ eingeben.
Jetzt werden Sie nach dem Urchin Installations-Pfad gefragt. Je nach dem in welchem Pfad Sie Urchin installiert haben, passen Sie den Installations-Pfad an und bestätigen. Der Default für eine Urchin-Installation ist „/usr/local/urchin“
Das wars auch eigentlich schon. Ihnen wird angezeigt, dass die Ausführung des Installationsscripts erfolgreich war.
Es wird noch ein Befehl angezeigt, mit der Sie sich den Status des Services anzeigen lassen können. Geben Sie ihn einfach mal ein, um zu sehen, ob die Installation erfolgreich war.
./install_urchin_daemons.sh –l
Sollte alles ordnungsgemäß funktionieren, sollte Runlevel 3 und 5 auf „on“ stehen.
Ab jetzt werden MySQL und Urchin automatisch nach jedem Neustart ausgeführt.
Viel Erfolg bei der Installation!
Ihr Daniel Benz
In diesem Artikel werden die nötigen Schritte definiert und erläutert, um das Auswerten von Besuchern und deren Verhalten mit Urchin Software (Version 6 und 7) zu gewährleisten. Dabei wird auch auf die die Koexistenz der beiden Analyse-Systemen (Urchin Software und Google Analytics) eingegangen, sowie die verschiedenen Tracking Codes und deren Abrufmöglichkeiten erläutert.
Grundsätzlich wird der Tracking Code in Abhängigkeit seiner Herkunft abgerufen, d. h. wenn der Tracking Code von Google Analytics zum Einsatz kommt, wird die Datei urchin.js oder ga.js primär von den Google-Servern abgerufen werden. Findet hingegen der Urchin Tracking Code Verwendung, wird dieser normalerweise von den lokalen Webservern abgerufen.
Urchin Software | Google Analytics | |
---|---|---|
Tracking Code | urchin.js | urchin.js, ga.js, asynchron |
Abruf via http | lokaler Webserver | Google-Server |
Abruf via https | lokaler Webserver | Google-Server |
Bitte beachten Sie die nachfolgend beschriebenen Anpassungen für die Verwendung mit den verschiedenen Einsatz-Szenarien im Abschnitt „Integration des Tracking Code für verschiedene Szenarien„.
Per Design wird beim Einsatz von Urchin Software der Tracking Code primär lokal vom Webserver aufgerufen:
<script src="/urchin.js" type="text/javascript">
Dabei spielt es keine Rolle, ob es sich bei dem Webserver um einen Standard-Webserver (http) oder einen Secure-Webserver (https) handelt.
Da die hier beschriebene Abrufweise dem Standard entspricht, können verschiedene Gründe (z. B. Performanz der Website, Traffic, etc.) dafür ausschlaggebend sein, den Tracking Code ausgelagert abrufen zu wollen. Bevor Sie sich nun um ein CDN (Content Distribution Network, z. B. Akamai) kümmern, ist der externe Abruf des Tracking Code problemlos von Google möglich. Der nachfolgende Abschnitt zeigt auf, wie die Umsetzen erfolgt.
Wie schon erwähnt, kann der Tracking Code für den Einsatz mit Google Analytics auf verschiedene Arten abgerufen werden. Allen nachfolgend beschriebenen Abrufmethoden gemein ist jedoch, dass diese auch für den Einsatz mit Urchin geeignet sind.
Abruf von urchin.js vom Google Server über http
Der Abruf des Tracking Code beschreibt das Standard-Szenario für den Einsatz von urchin.js mit Google Analytics:
<script src="http://www.google-analytics.com/urchin.js" type="text/javascript">
Abruf von urchin.js vom Google Server über https
Der Abruf des Tracking Code beschreibt das Szenario für den Einsatz von urchin.js mit Google Analytics auf einem Secure Webserver (SSL):
<script src="https://ssl.google-analytics.com/urchin.js" type="text/javascript">
Abruf von urchin.js vom lokalen Server über http
Der Abruf des Tracking Code beschreibt das Szenario für den Einsatz von urchin.js, welches auf einem beliebigen Webserver vorgehalten wird, mit Google Analytics:
<script src="http://www.meine-domain.de/urchin.js" type="text/javascript">
Bitte stellen Sie sicher, dass Sie den Tracking Code in das root-Verzeichnis Ihres Webservers kopiert haben und ersetzen Sie www.meine-domain.de durch die Domain, auf welcher der Tracking Code vorgehalten wird.
Abruf von urchin.js vom lokalen Server über https
Der Abruf des Tracking Code beschreibt das Szenario für den Einsatz von urchin.js, welches auf einem beliebigen Secure-Webserver (SSL) vorgehalten wird, mit Google Analytics:
<script src="https://ssl.meine-domain.de/urchin.js" type="text/javascript">
Bitte stellen Sie sicher, dass Sie den Tracking Code in das root-Verzeichnis Ihres Webservers kopiert haben und ersetzen Sie ssl.meine-domain.de durch die Domain, auf welcher der Tracking Code vorgehalten wird.
Abruf von ga.js vom Google Server (gleichgültig, ob http oder https)
<script type="text/javascript"> var gaJsHost = (("https:" == document.location.protocol) ? "https://ssl." : "http://www."); document.write(unescape("%3Cscript src='" + gaJsHost + "google-analytics.com/ga.js' type='text/javascript'%3E%3C/script%3E")); </script>
Abruf von ga.js vom lokalen Server (gleichgültig, ob http oder https)
<script type="text/javascript"> var gaJsHost = (("https:" == document.location.protocol) ? "https://" : "http://"); document.write(unescape("%3Cscript src='" + gaJsHost + "www.meine-domain.de/ga.js' type='text/javascript'%3E%3C/script%3E")); </script>
Bitte stellen Sie sicher, dass Sie den Tracking Code in das root-Verzeichnis Ihres Webservers kopiert haben und ersetzen Sie www.meine-domain.de durch die Domain, auf welcher der Tracking Code vorgehalten wird.
Grundsätzlich kann der Urchin Tracking Code an nahezu jeder beliebigen Stelle im HTML-Code einer Webseite integriert werden. Wir raten jedoch dazu, den Tracking Code entweder unmittelbar vor den Tag </head> oder direkt nach dem Tag <body> einzupflegen. Dadurch wird sichergestellt, dass der Tracking Code ausgeführt wird, bevor Seiteninhalte im Browser sichtbar werden.
Tracking Code vor </head>
Wird der Urchin Tracking Code vor dem Tag </head> integriert, sollte das in etwa wie folgt aussehen:
<head> ... <script src="/urchin.js"> </script> <script type="text/javascript"> _userv=0; urchinTracker(); </script> </head> <body> ... </body>
Tracking Code nach <body>
Wird der Urchin Tracking Code nach dem Tag </body> integriert, sollte das in etwa wie folgt aussehen:
<head> ... </head> <body> <script src="/urchin.js"> </script> <script type="text/javascript"> _userv=0; urchinTracker(); </script> ... </body>
In dem nachfolgenden Abschnitt wird erläutert, wie Sie den Tracking Code in Ihrer Website integrieren und ggf. anpassen sollen. Hierbei wird auf den Einsatz von Urchin als Stand-Alone-Analyse-System gleichermaßen eingegangen wie auch auf Google Analytics, wenn die Analyse beispielsweise über beide Systeme erfolgen soll.
Im nachfolgend beschriebenen Szenario wird ausschließlich Urchin verwendet, um die Analyse durchzuführen. Hierzu sind die unten stehenden Schritte durchzuführen:
Schritt 1 – Kopieren des Tracking Code und der Grafikdatei
Im Verzeichnis /urchin/util/utm Ihrer Urchin Installation finden Sie die folgenden beiden Dateien:
Kopieren Sie bitte beide Dateien in das Root-Verzeichnis des jeweiligen Webservers.
Schritt 2 – Integration des Tracking Code
Integrieren Sie das folgende Code-Snippet in den HTML-Code jeder zu analysierenden Webseite:
<script src="/urchin.js" type="text/javascript"> </script> <script> _userv=0; urchinTracker(); </script>
Sofern Sie ein CMS (Content Management System) einsetzen, sollten Sie den Tracking Code über eine entsprechende Vorlage (Template, Container, etc.) in den einzelnen Seiten verfügbar machen.
Das hier beschriebenen Szenario verwendet Google Analytics und Urchin Software gleichzeitig, um Analysen durchzuführen. Dies geschieht unter der Verwendung des auf den Servern von Google befindlichen „alten“ Tracking Code (urchin.js).
Es sind dabei die unten stehenden Schritte durchzuführen:
Schritt 1 – Kopieren der Grafikdatei
Kopieren Sie die Datei __utm.gif aus dem Verzeichnis /urchin/util/utm Ihrer Urchin Installation in das Root-Verzeichnis des Webservers.
Schritt 2 – Anpassen des Tracking Code
Damit der Aufruf des Tracking Code und den darin enthaltenen Funktionen die Informationen sowohl zu Google als auch in Ihre lokalen Webserver Logfiles überträgt, ist das Hinzufügen einer zusätzlichen Zeile im Code-Aufruf nötig:
_userv=2;
Stellen Sie bitte sicher, dass diese Zeile vor dem Aufruf der eigentlichen Tracking-Funktion urchinTracker() platziert wird (siehe auch nachfolgenden Schritt 2).
Schritt 3 – Integration des Tracking Code
Integrieren Sie das folgende, angepasste Code-Snippet in den HTML-Code jeder zu analysierenden Webseite:
< script src="http://www.google-analytics.com/urchin.js" type="text/javascript"> </script> <script> _uacct = "UA-XXXXXX-XX"; _userv=2; urchinTracker(); </script>
Ersetzen Sie bitte UA-XXXXXX-XX durch Ihre Google Analytics Kontonummer.
Sofern Sie ein CMS (Content Management System) einsetzen, sollten Sie den Tracking Code über eine entsprechende Vorlage (Template, Container, etc.) in den einzelnen Seiten verfügbar machen.
In diesem Szenario wird Google Analytics und Urchin Software ebenfalls gleichzeitig zur Durchführung der Analyse verwendet. Diesmal kommt jedoch der auf den Google-Servern befindliche Tracking Code „ga.js“ zum Einsatz.
Es sind die nachstehenden Schritte durchzuführen:
Schritt 1 – Kopieren der Grafikdatei
Kopieren Sie die Datei __utm.gif aus dem Verzeichnis /urchin/util/utm Ihrer Urchin Installation in das Root-Verzeichnis des Webservers.
Schritt 2 – Anpassen des Tracking Code
Damit der Aufruf des Tracking Code und den darin enthaltenen Funktionen die Informationen sowohl zu Google als auch in Ihre lokalen Webserver Logfiles überträgt, ist das Hinzufügen einer zusätzlichen Zeile im Code-Aufruf nötig:
pageTracker._setLocalRemoteServerMode();
Stellen Sie hierbei bitte sicher, dass diese Zeile vor dem Aufruf der eigentlichen Tracking-Funktion pageTracker._trackPageview() platziert wird (siehe auch nachfolgenden Schritt 2).
Schritt 3 – Integration des Tracking Code
Integrieren Sie das folgende, angepasste Code-Snippet in den HTML-Code jeder zu analysierenden Webseite:
< script> var gaJsHost = (("https:" == document.location.protocol) ? "https://ssl." : "http://www."); document.write(unescape("%3Cscript src='" + gaJsHost + "google-analytics.com/ga.js' type='text/javascript'%3E%3C/script%3E")); </script> <script> var pageTracker = _gat._getTracker("UA-XXXXXX-XX"); pageTracker._setLocalRemoteServerMode(); pageTracker._trackPageview(); </script>
Ersetzen Sie bitte UA-XXXXXX-XX durch Ihre Google Analytics Kontonummer.
Sofern Sie ein CMS (Content Management System) einsetzen, sollten Sie den Tracking Code über eine entsprechende Vorlage (Template, Container, etc.) in den einzelnen Seiten verfügbar machen.
Im (derzeit) letzten möglichen Szenario wird Google Analytics und Urchin Software ebenfalls gleichzeitig zur Durchführung der Analyse verwendet. Allerdings findet diesmal der asynchrone Tracking Code von Google Verwendung.
Es sind die unten stehenden Schritte durchzuführen:
Schritt 1 – Kopieren der Grafikdatei
Kopieren Sie die Datei __utm.gif aus dem Verzeichnis /urchin/util/utm Ihrer Urchin Installation in das Root-Verzeichnis des Webservers.
Schritt 2 – Anpassen des Tracking Code
Damit der Aufruf des Tracking Code und den darin enthaltenen Funktionen die Informationen sowohl zu Google als auch in Ihre lokalen Webserver Logfiles überträgt, ist das Hinzufügen einer zusätzlichen Zeile im Code-Aufruf nötig:
_gaq.push([‚_setLocalRemoteServerMode‘]);
Stellen Sie hierbei bitte sicher, dass diese Zeile vor dem Aufruf der eigentlichen Tracking-Funktion _gaq.push([‚_trackPageview‘]); platziert wird (siehe auch nachfolgenden Schritt 2).
Schritt 3 – Integration des Tracking Code
Integrieren Sie das folgende, angepasste Code-Snippet in den HTML-Code jeder zu analysierenden Webseite:
<script type="text/javascript"> var _gaq = _gaq || []; _gaq.push(['_setAccount', 'UA-XXXXXX-XX']); _gaq.push(['_setLocalRemoteServerMode']); _gaq.push(['_trackPageview']); (function() { var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true; ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js'; var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s); })(); </script>
Ersetzen Sie bitte UA-XXXXXX-XX durch Ihre Google Analytics Kontonummer.
Sofern Sie ein CMS (Content Management System) einsetzen, sollten Sie den Tracking Code über eine entsprechende Vorlage (Template, Container, etc.) in den einzelnen Seiten verfügbar machen.
Wichtiger Hinweis: Der asynchrone Tracking Code darf nur vor dem Tag </head> integriert werden.
Nachdem Sie die Umsetzung eines der drei vorigen Szenarien durchgeführt haben, ist es wichtig, den Erfolg Ihrer Maßnahmen zu überprüfen. Hierzu sollten Sie zunächst Ihre Website im Browser öffnen und dort diverse Seiten aufrufen.
Im Logfile Ihres Webservers sollten sich sodann Einträge befinden, die dem nachfolgenden ähnlich sehen:
82.100.192.194 www.webalytics.de – [13/Aug/2008:07:30:21 +0200] „GET /__utm.gif?utmwv=1.3&utmn=1519430064
&utmcs=ISO-8859-1&utmsr=1024x 768&utmsc=32-bit&utmul=de&utmje=1&utmfl=9.0%20%20r28&utmcn=1&utmd t=Profess
ionelle%20Webseitenanalyse%20%7C%20webalytics&utmhn=www.webalytics.de&utmhid=819818407&utmr=http://www.go
ogle.com/analytics/de-DE/sup port_partner_provided.html&utmp=/ HTTP/1.1″ 200 35 „http: //www.webal ytics.
de/“ „Mozilla/5.0 (Windows; U; Windows NT 5.1; de; rv:1.8.1.16) Gecko/20080702 Firefox/2.0.0.16″ „__utma=
11519430064.1218605418.1218605418.1218605418.1; __utmb=1; __utmc =1; __utmz=1.1218605418.1.1.utmccn=(refe
rral)|utmcsr=google.com|utmcct=/analytics/de-DE/support_partner_provided.html|utmcmd=referral″
Beachten Sie dabei die zusätzlichen UTM-Cookie-Informationen am Ende der Zeile.
Bei der Verwendung von Google Analytics bzw. Urchin Software herrscht zuweilen ein großes Missverständnis, was denn nun der Unterschied zwischen neuen, wiederkehrenden und eindeutigen Besuchern wäre. Gibt es diesen überhaupt? Und warum weichen die Zahlen bei der Betrachtung unterschiedlicher und kumulierter Zeiträume ab? Licht in das Dunkel zu bringen ist die primäre Intention dieses Artikels.
Bevor wir uns dem Hauptthema dieses Dokuments widmen, müssen wir zunächst einmal betrachten, was passiert, wenn ein Nutzer erstmals Ihre Website besucht.
Wie Sie sicherlich schon erfahren haben, arbeiten Google Analytics und Urchin Software mit sogenannten First Party Cookies – kleinen Textdateien, die auf der Festplatte des Rechners im Kontext des Browsers sowie Ihrer Websitegespeichert werden. Diese Cookies enthalten (anonyme) Informationen über den Besucher, die bei jedem Besuch auf Ihrer Website erstmals erstellt oder ausgelesen und aktualisiert werden.
Bei Google Analytics und Urchin Software kommen in Summe fünf Cookies zum Einsatz, von denen aber für unser Thema hier nur drei von Belang sind. Die für die Ermittlung von Besucherzahlen relevanten Cookies sind:
Diese werden nachfolgend erläutert.
Die nachfolgende Grafik zeigt den schematischen Aufbau des __utma-Cookies:
Aus dieser Grafik lassen sich folgende Erkenntnisse ableiten:
Ein Tool zum Umrechnen der UNIX-Zeit in Datum und Uhrzeit finden Sie unter http://myg8.de/unix-time
Beispiel
Zerlegen wir zur Verdeutlichung einmal folgende Beispielwerte in ihre Bestandteile:
__utma=226596891.310448942.1223700280.1245836053.1245861411.7 | |||
Bereich | Zeitpunkt des ersten Besuchs | Beginn der vorigen Sitzung |
Beginn der aktuellen Sitzung |
Wert (UNIX-Zeit) | 1223700280 | 1245664200 | 1245856800 |
Datum, Zeit | Sat, 11 Oct 2008 04:44:40 GMT | Mon, 22 Jun 2009 09:50:00 GMT | Wed, 24 Jun 2009 15:20:00 GMT |
Daraus wird deutlich, dass dieser Besucher die maßgebliche Website am 11.10.2008 erstmals besucht hat. Des Weiteren wurde die aktuelle Sitzung am 24.06.2009 um 15:20 Uhr und die vorige Sitzung am 22.06.2009 um 9:50 Uhr begonnen. Es liegen also 29,5 Stunden zwischen dem aktuellen und dem vorigen Besuch.
Diese beiden Cookies bestehen grundsätzlich aus dem Domain Hash (Prüfsumme) und kennzeichnen eine Sitzung.
Das __utmb-Cookie hat eine Gültigkeit von 30 Minuten und verfällt dementsprechend nach einer halben Stunde Inaktivität. Beim __utmc-Cookie hingegen handelt es sich um ein sogenanntes Temporär-Cookie, welches beim Schließen des Browsers verfällt.
Beispiele
Da weder __utmb noch __utmc verfallen sind, agiert der Besucher noch im Kontext der gleichen Sitzung.
Aufgrund der Dauer der Unterbrechung ist in dem vorgenannten Beispiel das __utmb-Cookie verfallen (30 Minuten Inaktivität) und leitet bei erneuter Interaktion mit der Website eine neue Sitzung ein.
Sie können sich jederzeit die hier genannten Cookie-Informationen anzeigen lassen. Nachfolgend wird erläutert, wie Sie die an die Informationen beim Einsatz mit einem der gängigen Browsern gelangen.
Um die Cookie-Informationen mit dem Microsoft Internet Explorer (IE) anzeigen zu können, benötigen Sie eine Zusatzsoftware (Add-On), da der IE per Design keine Cookies anzeigen kann. Wir empfehlen hierfür das Add-On Cooxie Toolbar von Dioda Software, welches Sie hier herunterladen können: http://myg8.de/cooxie.
Sie können die Cookie-Informationen beim Mozilla Firefox einfach abrufen, indem Sie im Menü Extras (engl.: Tools) auf den Eintrag Einstellungen (engl.: Options) klicken. Klicken Sie dann auf das Icon Datenschutz (engl.: Privacy) und danch auf den Link einzelne Cookies (engl.: remove individual cookies).
Sie können sich die Cookies in Google Chrome anzeigen lassen, indem Sie auf das Icon Google Chrome anpassen und dann auf den Menüeintrag Optionen klicken. Wechseln Sie auf die Registerkarte Details (engl.: Under the hood) und klicken Sie auf die Schaltfläche Content Einstellungen… (engl.: Content settings…) und danach auf die Schaltfläche Cookies und andere Websitedaten anzeigen… (engl.: Show cookies and other site data).
Nachdem nun die Grundlagen zum Verständnis der Cookie-Funktionalität und -Werte geschaffen ist, können wir uns dem eigentlichen Thema dieses Whitepapers widmen. In diesem Abschnitt wird erläutert, wie neue und wiederkehrende Besucher gezählt und unterschieden werden.
Ein Besucher wird – wie bereits im vorigen Abschnitt erklärt – anhand seines __utma-Cookies eindeutig identifiziert. In diesem Cookie sind die drei Zeitangaben Zeitpunkt des ersten Besuchs, Beginn der vorigen Sitzung und Beginn der aktuellen Sitzung enthalten. Besucht der Nutzer Ihre Website zum ersten Mal, sind alle der vorgenannten Zeitangaben identisch.
Beispiel
__utma=226596891.310448942.1246032000.1246032000.1246032000.1 | |||
Bereich | Zeitpunkt des ersten Besuchs |
Beginn der vorigen Sitzung |
Beginn der aktuellen Sitzung |
Wert (UNIX-Zeit) | 1246032000 | 1246032000 | 1246032000 |
Datum, Zeit | Fri, 26 Jun 2009 16:00:00 GMT | Fri, 26 Jun 2009 16:00:00 GMT | Fri, 26 Jun 2009 16:00:00 GMT |
Da alle drei Zeitangaben identisch sind, kann aus den oben dargestellten Werten geschlossen werden, dass der Nutzer die Website zum ersten Mal besucht.
Anknüpfend an das vorige Thema Wann ist ein Besucher „neu“? nehmen wir auch hier wieder das __utma-Cookie als Grundlage dafür, um zu ermitteln, wann ein Besucher als „wiederkehrend“ eingestuft werden kann. Dazu ist es erneut nötig, einen Blick auf die Zeitangaben im __utma-Cookie zu werfen.
Unterscheidet sich die Zeitangabe „Zeitpunkt des ersten Besuchs“ von dem Wert in „Beginn der aktuellen Sitzung“, hat der Nutzer die Website bereits vor der aktuellen Sitzung besucht.
Beispiel
__utma=226596891.310448942.1246032000.1246032000.1246113000.2 | |||
Bereich | Zeitpunkt des ersten Besuchs |
Beginn der vorigen Sitzung |
Beginn der aktuellen Sitzung |
Wert (UNIX-Zeit) | 1246032000 | 1246032000 | 1246113000 |
Datum, Zeit | Fri, 26 Jun 2009 16:00:00 GMT | Fri, 26 Jun 2009 16:00:00 GMT | Sat, 27 Jun 2009 14:30:00 GMT |
Da die Werte der Zeitangaben „Zeitpunkt des ersten Besuchs“ und „Beginn der aktuellen Sitzung“ differieren, die Werte der Zeitangaben „Zeitpunkt des ersten Besuchs“ und „Beginn der vorigen Sitzung“ jedoch identisch sind, kann aus den oben dargestellten Werten geschlossen werden, dass der Nutzer die Website zum zweiten Mal besucht.
Wären nun alle drei Werte der Zeitangaben unterschiedlich, hätte der Nutzer die Website mehr als zwei Mal besucht. Um nun festzustellen, zum wievielten Mal der Nutzer die Website besucht hat, existiert im __utma-Cookie der Sitzungszähler (letzter Wert des Cookies). Dieser wird bei jedem erneuten Besuch um den Wert 1 erhöht (Integer).
Auch für die Erläuterung in diesem Zusammenhang wird das __utma-Cookie herangezogen. Wie bereits im Abschnitt Domain- und Besucher-Identifizierung: __utma erklärt, wird die eindeutige ID zur Kennzeichnung eines Besuchers anhand von zwei Werten des __utma-Cookies erstellt:
Somit wird ein Besucher immer wieder „erkannt“, wenn er/sie Ihre Website besucht – ganz gleich, ob er die Website zum ersten Mal von einer Stunde, einem Tag oder einem Jahr besucht hat.
Beispiel
__utma=226596891.310448942.1246032000.1246032000.1246113000.2 | ||
Bereich | Besucher ID | Zeitpunkt des ersten Besuchs |
Wert | 310448942 | 1246032000 |
Eindeutige ID | 310448942.1246032000 |
Nachdem nun die Nomenklatur bekannt ist und definiert wurde, was neue, wiederkehrende und absolut eindeutige Besucher sind, wenden wir uns jetzt der Betrachtungsweise innerhalb der Auswertung zu.
Die Auswertung eindeutiger Besucher gestaltet sich denkbar einfach und ist immer pro Zeitraum Ihrer Auswertung zu betrachten.
Somit wichtig zu verstehen, dass ein Besucher, der anhand des Werts „Eindeutige ID“ identifiziert wurde, beliebig oft Ihre Website besuchen und Seiteninhalte abrufen kann – er wird dennoch immer ein und der selbe Besucher bleiben.
In der nachfolgenden Zeitlinie wird deutlich, dass der Nutzer „Besucher A“ die maßgebliche Website innerhalb des Betrachtungszeitraums (01.06.2009 – 07.06.2009) insgesamt fünf mal besucht hat.
Wir wissen natürlich nicht, ob dieser Nutzer die Website bereits vor diesem Zeitraum besucht hat, dennoch gilt dieser Besucher als ein eindeutiger Besucher.
In der nachfolgende Zeitlinie kommt ein weiterer Besucher innerhalb des Betrachtungszeitraums (01.06.2009 – 07.06.2009) hinzu. Es wird deutlich, dass die maßgebliche Website in Summe sieben Mal besucht wurde.
Trotzdem gelten die Nutzer „Besucher A“ und „Besucher B“ als jeweils ein eindeutiger Besucher, was in Summe zwei eindeutige Besucher im Betrachtungszeitraum ergibt.
Aus der nachfolgenden Tabelle wird ersichtlich, dass die Gesamtzahl der eindeutigen Besucher ausschließlich vom Betrachtungszeitraum abhängt und somit die Aggregation von mehreren Betrachtungszeiträumen nicht zur Aufsummierung der Werte, sondern zu deren Konsolidierung führt.
Die Auswertung neuer und wiederkehrender Besucher gestaltet sich etwas schwieriger, da hierbei zunächst einmal bekannt sein muss, wann der Nutzer eine Website zum ersten Mal besucht hat. Glücklicherweise nimmt uns das __utma-Cookie diese Arbeit ab.
In der nachfolgenden Zeitlinie wird deutlich, dass der Nutzer „Besucher A“ die maßgebliche Website innerhalb des Betrachtungszeitraums (01.06.2009 – 07.06.2009) insgesamt fünf mal besucht hat.
Einmal angenommen, der Nutzer „Besucher A“ hat die maßgebliche Website am 01.06.2009 zum ersten Mal besucht, dann würde er bei der Analyse als ein neuer Besucher und vier Mal als wiederkehrender Besucher gewertet werden.
Hat der Nutzer „Besucher A“ die maßgebliche Website hingegen vor dem Betrachtungszeitraum bereits besucht, würde er bei der Analyse fünf Mal als wiederkehrender Besucher gewertet werden.
In der nachfolgende Zeitlinie kommt ein weiterer Besucher innerhalb des Betrachtungszeitraums (01.06.2009 – 07.06.2009) hinzu. Es wird deutlich, dass die maßgebliche Website in Summe sieben Mal besucht wurde.
Auch hier gilt: Haben die Nutzer „Besucher A“ und „Besucher B“ die maßgebliche Website im Betrachtungszeitraum zum ersten Mal besucht, würden beide bei der Analyse als jeweils ein neuer Besucher gewertet werden. Der Nutzer „Besucher A“ würde zudem vier Mal und der Nutzer „Besucher B“ ein Mal als wiederkehrender Besucher gezählt werden.
Waren beide Nutzer bereits zuvor Besucher der maßgeblichen Website gelten die Besucher als jeweils wiederkehrender Besucher bei der Analyse („Besucher A“ 5; „Besucher B“ 2).
Aus der nachfolgenden Tabelle wird ersichtlich, dass die Besucherzahlen einzelner Betrachtungszeiträume addiert werden können, wenn es darum geht, diese zu einem größeren Betrachtungszeitraum zusammenzufassen.
Nachfolgend listen wir die häufigsten Fragen und deren Antworten auf, die uns in diesem Zusammenhang immer wieder gestellt werden.
Was passiert, wenn jemand standardmäßig seine Cookies beim Beenden des Browsers löscht?
Sobald die Cookies gelöscht werden, ist auch das __utma-Cookie und somit die Werte für „Besicher ID“ und „Zeitpunkt des ersten Besuchs“ nicht mehr existent. Das bedeutet, dass für einen solchen Nutzer das __utma-Cookie bei jedem Besuch der Website neu erstellt wird und er somit immer als ein absolut eindeutiger und neuer, nie aber als wiederkehrender Besucher gewertet wird.
Was passiert, wenn der Besuch der Website über eine Firewall, NAT-Device oder Caching Proxy erfolgt?
Die vorgenannten Szenarien haben keinerlei Auswirkung auf die Erstellung der Cookies und somit wird ein solcher Nutzer auch korrekt ausgewertet.
Was passiert, wenn jemand die Ausführung von JavaScript in seinem Browser deaktiviert hat?
In diesem Fall wird der Nutzer gar nicht als Besucher gewertet, da der Tracking Code auf JavaScript basiert und die Cookies erst bei Ausführung dessen erstellt werden.
Was passiert, wenn die Besuche auf der Website über verschiedene Browser von einem Rechner erfolgen?
Da für die Berechnung der Cookies auch die Rechnerumgebung des Nutzers einbezogen wird, werden für jeden genutzten Browser eigene Cookies erstellt.
Hat ein Nutzer beispielsweise drei unterschiedliche Browser auf seinem Rechner installiert (z. B. Microsoft IE, Mozilla Firefox und Google Chrome) und besucht er mit jedem der Browser ein und dieselbe Website, werden dennoch drei unterschiedliche __utma-Cookies in den Browsern auf Seiten den Nutzers erstellt und er gilt somit auch als drei absolut eindeutige Besucher.
Ganz einfach: Wir wollen Ihnen den Erklärungsnotstand ersparen, wenn das „Upper Management“ wissen will, warum es bei den Werten zu Unterschieden kommt… 🙂
Das eintägige Training für technisch versierte Mitarbeiter und Administratoren vermittelt die detaillierten Kenntnisse, welche für die Installation, die Einrichtung und den Betrieb von Urchin Software 6 nötig sind.
Hierbei wird die Installation des Datenbank-Servers ebenso erläutert wie auch die Lizenzierung und Aktivierung, Verzeichnisstruktur und Datensicherungsszenarien sowie Datei- und Datenoperationen. Zusätzlich werden Best Practices für den Umgang mit Protokollquellen, Suchtabellen und Master Tracking Codes eingehend beleuchtet. Co-Branding von Urchin sowie die Koexistenz mit Google Analytics runden das Inhaltsportfolio ab.
In unserem Blog-Artikel „Ladezeit einer Webseite ab sofort Kriterium für Google’s Search Rank“ berichteten wir bereits darüber, dass langsame Webseiten unter Umständen einen schlechteren PageRank erhalten.
Dieser Umstand wirft natürlich die Frage auf, inwieweit sich der Einsatz von Tracking Tools (Google Analytics, Urchin Software, ClickTale, etc.) auf den PageRank auswirkt. Diese Frage wurde auch an Matt Cutts, den SEO-Spezialist der Google Search Quality Group, herangetragen. Er beantwortet die Frage in seinem Video-Blog:
Somit kann zusammenfassend festgehalten werden, dass der Einsatz von Google’s Asynchronous Tracking Code keine nennenswerten Auswirkungen auf die Ladezeiten einer Webseite hat deren PageRank nicht gefährdet.
Um diese Aussage zu verifizieren, haben wir die Ladezeiten der unterschiedlichen Tracking Codes in einer einfachen Seite gemessen. Nachfolgend finden Sie die Auswertung dazu:
Tracking Code | Analyse Tool | Herkunft | Position | Ladezeit |
urchin.js | Urchin | lokal | nach <body> | 663 ms |
ga.js | Google Analytics | extern | nach <body> | 215 ms |
asynchronous | Google Analytics | extern | vor </head> | 202 ms |
Was aber, wenn der Website-Betreiber derzeit ein anderes Analyse-Tool zur Auswertung des Besucherverhaltens einsetzt? Schließlich existieren gerade in Deutschland bzw. Europa mannigfaltige Gründe dafür: Datenschutz, Paranioa, Aversion gegen Google, etc. Was also, wenn die Analyse nicht mit Google Analytics erfolgt und es durch den Einsatz eines oder gar mehrerer anderer Tracking Codes zu Latenzen kommt?
Ein sehr probater wenn auch teurer Lösungsansatz stellt der Einsatz eines Content Distribution Network, kurz CDN, dar. Damit sorgen Sie für die zuverlässige und schnelle Auslieferung von Inhalten – auch Tracking Codes. Mehr über die Funktionsweise von CDNs finden Sie im deutschen Wikipedia.
Ja, Sie haben richtig gelesen. Auch wenn Sie Urchin beispielsweise aufgrund Datenschutz einsetzen oder weil Sie die Daten inhouse halten möchten, ist der Einsatz des Google Analytics Asynchronous Tracking Code durchaus eine Überlegung wert. Dass der Tracking Code nur etwas ein Drittel der Ladezeit benötigt gegenüber der klassischen Urchin-eigenen JavaSkript-Datei benötigt, haben Sie aus der obigen Aufstellung erfahren.
Wie können Sie nun aber den Google Analytics Asynchronous Tracking Code einsetzen OHNE dabei gegen Datenschutzrichtlinien Ihrer Firma zu verstoßen? In der Tat ist das ganz einfach: Da der Tracking Code öffentlich abgerufen werden kann, benötiogen Sie nicht einmal ein Google-Konto, um diesen einzusetzen. Des Weiteren müssen Sie lediglich zwei kleine Änderungen im Quellcode durchführen.
Vorgehensweise, nachdem Sie sich den Code-Snippet des aktuellen Google Analytics Asynchronous Tracking Code besorgt haben:
1. Entfernen Sie daraus die Zeile mit der Konto-ID
_gaq.push(['_setAccount', 'UA-xxxxxx-xx']);
2. und fügen Sie stattdessen die folgende Zeile hinzu:
_gaq.push(['_setLocalServerMode']);
Der Code-Snippet sollte dann wie folgt aussehen:
<script type="text/javascript"> var _gaq = _gaq || []; _gaq.push(['_setLocalRemoteServerMode']); _gaq.push(['_trackPageview']); (function() { var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true; ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js'; var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s); })(); </script>
Mit dieser Modifikation stellen Sie sicher, dass Ihnen beim Abruf der JavaSkript-Datei definitiv keine Daten zugeordnet werden können und – viel wichtiger – keine Nutzungsdaten Ihrer Website an Google übermittelt werden. Stattdessen werden die Daten ausschließlich in das lokale Logfile Ihres Webservers geschrieben. Zudem der Tracking Code bei Google abgerufen, wodurch die Ladezeit Ihrer Seiten positiv beeinflusst werden. Also alles in allem eine sinnvolle Vorgehensweise…