Datenschutzkonforme Webanalyse mit Urchin 7

Urchin 7, die aktuellste Version der beliebten Webanalyse-Software, präsentiert sich leistungsstark und ganz im „Google Look & Feel“. Die professionelle Webanalyse-Software punktet äußerlich mit übersichtlicherer Benutzeroberfläche, klaren Grafiken und einfacher Navigation. Aber hinter dem smarten Erscheinungsbild steckt auch mehr Leistung: Zusätzliche Berichte sowie die 64bit Version machen die Datenanalyse mit Urchin noch flexibler, noch schneller und noch effizienter. Doch wie schaut es mit der Datenschutzkonformität aus? Erfüllt Urchin die Anforderungen der Datenschützer?

Der Düsseldorfer Kreis…

Die datenschutzrechtlichen Anforderungen des Düsseldorfer Kreises umfassen folgende Punkte aus dem TMG (gem. Beschluss vom 26./27. November 2009 in Stralsund, PDF hier herunterladen) :

    Datenschutzkonforme Webanalyse durch Anonymisierung

     

  • Widerspruchsrecht: Den Betroffenen ist eine Möglichkeit zum Widerspruch gegen die Erstellung von Nutzungsprofilen einzuräumen. Derartige Widersprüche sind wirksam umzusetzen.
  • Datentrennung: Die pseudonymisierten Nutzungsdaten dürfen nicht mit Daten über den Träger des Pseudonyms zusammengeführt werden. Sie müssen gelöscht werden, wenn ihre Speicherung für die Erstellung der Nutzungsanalyse nicht mehr erforderlich ist, oder der Nutzer dies verlangt.
  • Hinweis bzgl. Erstellung pseudonymer Nutzungprofile: Auf die Erstellung von pseudonymen Nutzungsprofilen und die Möglichkeit zum Widerspruch müssen die Anbieter in deutlicher Form im Rahmen der Datenschutzerklärung auf ihrer Internetseite hinweisen.
  • Datenerhebung: Personenbezogene Daten eines Nutzers dürfen ohne Einwilligung nur erhoben und verwendet werden, soweit dies erforderlich ist, um die Inanspruchnahme von Telemedien zu ermöglichen und abzurechnen. Jede darüber hinausgehende Nutzung bedarf der Einwilligung der Betroffenen.
  • IP-Adressen: Die Analyse des Nutzungsverhaltens unter Verwendung vollständiger IP-Adressen (einschließlich einer Geolokalisierung) ist aufgrund der Personenbeziehbarkeit dieser Daten daher nur mit bewusster, eindeutiger Einwilligung zulässig. Liegt eine solche Einwilligung nicht vor, ist die IP-Adresse vor jeglicher Auswertung so zu kürzen, dass eine Personenbeziehbarkeit ausgeschlossen ist.

Wie Urchin Daten erfasst…

Bevor ich jedoch auf die Frage nach dem Datenschutz eingehe, möchte ich Ihnen zunächst einmal verdeutlichen, wie die Daten in Urchin überhaupt erhoben werden. Die nachfolgende Grafik macht deutlich, wie Urchin Software die Daten erfasst, verarbeitet, aufbereitet und darstellt.

Workflow - Urchin

Der Prozess der Datenerfassung beginnt, sobald ein Besucher eine Webseite von einem Webserver abruft. Der Server antwortet, indem er die angeforderte Seite an den Browser des Besuchers sendet. Während der Browser die Seite aufbereitet und darstellt, wird ebenfalls das Script urchin.js abgerufen und der Tracking Code ausgeführt (1).

Bei der Ausführung des Codes werden verschiedene Eigenschaften in Bezug auf den Besucher und seine Browser-Umgebung ermittelt (z. B. wie of er die Website besucht hat, woher er kam, etc.).

Sobald alle erforderlichen Daten erfasst wurden, setzt oder aktualisiert (in Abhängigkeit der Situation) der Tracking Code einer bestimmte Anzahl von Cookies (2‚), in denen Informationen zum Besucher gespeichert werden.

Nachdem die Cookies erstellt bzw. aktualisiert wurden, sendet der Tracking Code die Daten zurück an den Webserver. Dies geschieht durch den Aufruf einer unsichtbaren GIF-Datei namens __utm.gif (3ƒ).

Sobald der Webserver den Aufruf der Datei erhält, werden die übermittelten Daten in einer großen Textdatei gespeichert („4). Diese Textdatei wird Logfile (oder Protokolldatei) genannt, und es befindet sich darin jeweils eine Zeile für jeden Aufruf einer Seite bzw. deren Elemente. Jede dieser Zeilen enthält verschiedene Attribute bezüglich des Seitenaufrufs, inklusive der Folgenden:

  • Wann wurde die Seite aufgerufen (Datum und Uhrzeit)
  • Woher kam der Besucher (Verweis, Suchmaschine, etc.)
  • Wie oft hat der Besucher die Website besucht (Anzahl Besuche)
  • Über welches Netzwerk kam der Besucher (IP-Adresse)

Nachdem der Seitenaufruf im Logfile vermerkt wurde, ist der Prozess der Datenerfassung abgeschlossen.

Der nächste Schritt ist die Datenverarbeitung und -aufbereitung. In einem regelmäßigen Intervall greift Urchin nun auf Logfiles zu (per Download, i. d. R. einmal täglich) und arbeitet diese dann ab (5…). Während des Verarbeitungsprozesses wird jede Datenzeile in ihre Bestandteile zerlegt. Nachfolgend sehen Sie einen Auszug aus einem Logfile. Bitte beachten Sie, dass es sich hierbei nicht um ein tatsächliches Logfile für Urchin handelt, sondern vielmehr Demonstrationszwecken dienen soll:

82.100.192.194 www.webalytics.de - [11/Feb/2008:08:52:54 +0100] "GET /__utm.gif ?utmwv=1&utmn=426395627&utmcs=iso-8859-1&utmsr=1280x1024&utmsc=32-bit&utmul=de& utmje=1&utmfl=9.0&utmcn=1&utmdt= Urchin%20Software%20-%20Base%20Module%20-%20UT M&utmhn=www.webalytics.de&utmr=http://www.google.de/search?q=%22SuSe+Linux+8%22 +download&hl=de&cr=countryDE&start=20&sa=N&utmp=/us/sw_mod_bm_systemanforderung .php HTTP/1.0" 200 35 "-" "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; . NET CLR 1.1.4322; .NET CLR 2.0.50727; .NET CLR3.0.04506.30)" "__utma=226596891. 426395627.1202716238.1202716238.1202716238.1; __utmb=226596891; __utmc=22659689 1; __utmz=226596891.1202716238.1.1.utmccn=(organic)|utmcsr=google|utmctr=%22SuS e+Linux+8%22+download|utmcmd=organic"

Während der größte Teil der Datenzeile eher schwer zu verstehen ist, lassen sich das Datum und die Uhrzeit des Besuchs (11.02.2008 um 08:52:54 Uhr), sowie die IP-Adresse des Besuchers (82.100.192.194) jedoch auf einen Blick erkennen.

Urchin teilt nun jede Datenzeile eines Logfiles in entsprechende Datenelemente, genannt „Felder“, auf (6†). Zum Beispiel wird aus der IP-Adresse das Feld „Besucher IP“. Es ist somit von größter Wichtigkeit zu verstehen, dass jeder Seitenaufruf eine Unmenge an Daten liefert, die wiederum in unterschiedlichen Feldern abgespeichert werden.

Nachdem jede Datenzeile in Felder aufgeteilt wurde, werden nun die Daten gefiltert (7‡). Filter stellen die Regeln dar, die Sie in Urchin hinzufügen und die somit beeinflussen, welche Daten in den Berichten erscheinen und wie diese dann aussehen.

Zuletzt werden die Berichte erstellt (8ˆ) und in der Datenbank von Urchin gespeichert (9‰). Jeder Bericht in Urchin wird durch den Vergleich von Feldern (z. B. Stadt) mit Ganzzahlen (Integer) errechnet (z. B. Besuche, Seitenansichten, Absprungrate, Konvertierungsrate, etc.).

Sobald die Daten in die Datenbank geschrieben wurden, ist der gesamte Prozess abgeschlossen. Wenn Sie oder ein anderer Benutzer nun einen Bericht in Urchin abrufen, werden die entsprechenden Daten aus der Datenbank gelesen und in einer übersichtlichen Berichtsform an den Browser gesendet (10Š).

Welche Daten genau in das Webserver-Logfile geschreiben werden, habe ich bereits ausführlich im Blog-Post _utm.gif oder Wie werden Daten für Urchin in das Logfile geschrieben? erläutert.

Datenschutzkonformität durch Urchin 7

Von den fünf vorgenannten Anforderungen des Düsseldorfer Kreises fallen wohl die erste und die dritte (Widerspruchsrecht und Hinweis bzgl. Erstellung pseudonymer Nutzungprofile) unter die Obliegenheit des Website-Betreibers und dessen technische Gegebenheiten. Für das Widerspruchsrecht bedeutet dies, dass der Betreiber einer Website dem Besucher eine Möglichkeit zum Widerspruch gegen die Erstellung von Nutzungsprofilen einräumen (sogenanntes Opt-Out) kann, indem er einfach eine Schaltfäche bzw. Checkbox auf der Website integriert. Diese würde dann nach Betätigung die Ausführung eines Tracking Codes einfach unterbinden. Eleganter kann dies mit der kostenfreien Lösung „Opt-Me-Out“ realisiert werden, die unter http://www.opt-me-out.de heruntergeladen werden kann.  In Bezug auf den Hinweis bzgl. Erstellung pseudonymer Nutzungprofile obliegt es dem Websitebetreiber, einen entsprechenden Passus in die Datenschutzerklärung zu integrieren. Hierbei sollte er sich an einen kundigen Rechtsanwalt wenden, der ihm wiederum eine geeignete Formulierung an die Hand gibt.

Datentrennung bei Urchin obligatorisch

Die geforderte Datentrennung ist primär schon dadurch gegeben, dass ein Nutzer sich auf einer Website nicht zwangsläufig zu erkennen geben muss. Dies ist immer nur dann der Fall, wenn sich beispielsweise der Nutzer zum Betreten eines geschlossenen Bereichs oder beim Checkout-Prozess eines Online-Shop-Kaufs  anmelden müsste. Aber selbst wenn das der Fall ist, werden die Anmeldedaten per Design nicht im Webserver-Logfile vermerkt.

Und bei E-Commerce?

Auch bei der Auswertung von E-Commerce-Daten werden mittels Urchin nur Daten erfasst, die mit dem Produkt selbst in Verbindung stehen:

  • Vorgangsnummer der Transaktion
  • Gesamtbetrag
  • Steuerbetrag
  • Versandkosten
  • Lieferstadt
  • Lieferregion (Bundesland, Kanton, o.ä.)
  • Lieferland
  • Artikel- bzw. Herstellernummer
  • Artikelbezeichnung
  • Produkt-Kategorie bzw. Warengruppe
  • Einzelpreis
  • Menge

Somit ist eine Korrelation der erfassten E-Commerce-Daten mit denen des Käufers  gar nicht möglich.

Urchin erhebt Daten immer ohne Personenbezug

Der Einsatz von Urchin in Kombination mit dem Urchin Tracking Code erhebt ausschließlich Daten bezüglich der abgerufenen Seiten einer Website inklusive Dimensionsdaten wie z.B. Bildschirmauflösungen, eingesetzte Flashversion, Betriebssystem, Browser, Verweisseite, kampagnenrelevante Daten (Quelle, Medium, Keyword, Inhalt, Kampagnenname),  etc. Personenbezogene Daten werden erst gar nicht erhoben, da sich die Besucheridentifikation lediglich auf die Unterscheidung zwischen neuen bzw. wiederkehrenden Besuchern beschränkt und sich aus folgenden Werten zusammensetzt:

  • Domainprüfsumme
  • BesucherID (errechnet aus Umgebungsvariablen des benutzten Rechners)
  • Zeitpunkt des ersten Besuchs
  • Beginn der letzten Sitzung
  • Beginn der aktuellen Sitzung
  • Sitzungszähler

Hier wird deutlich, dass keinerlei personenbezogene oder -identifizierbare Daten gespeichert werden. Die erhobenen Daten werden im sogenannten _utma-Cookie gespeichertund bei jedem Webseitenabruf aktualisiert.

Aufbau des _utma-Cookies

Der Teil des Cookies, welcher dem Besucher eine eindeutige Identifizierbarkeit zuweist, besteht aus dem Teil „Besucher ID“ und dem Teil „Zeitpunkt des ersten Besuchs“. Nur die beiden Abschnitte in Kombination ermöglichen es Urchin festzustellen, ob der Besucher bereits bekannt ist oder nicht.

Der Wert für „Besucher ID“ wird anhand folgender Kriterien errechnet: Browser (Typ und Version), Betriebssystem (Typ und Version) Rechner sowie einer Zufallszahl. Somit unterscheidet sich dieser Wert, in Abhängigkeit des Rechners, der eingesetzten Software und logischerweise der Zufallszahl, für jeden Besucher. Das bedeutet aber auch im Umkehrschluss, dass ein Nutzer, der mit drei unterschiedlichen Browsern (IE, FF, Chrome) agiert, auch drei verschiedene Besucher darstellt.

Der Inhalt für „Zeitpunkt des ersten Besuchs“ wird seit 1970 in Sekunden ausgedrückt. Somit gilt: Wenn der Benutzer seine Cookies löscht, wird für jeden Besuch auf der selben Website eine neue, völlig andere „Eindeutige ID“ generiert.

Dadurch wird deutlich, dass in Urchin keinerlei Personenbezug vorhanden ist.

Urchin anonymisiert IP-Adressen teilweise oder in Gänze

Der Wunsch, IP-Adressen aus dem Internet zu verbannen, ist genauso irrelevant wie der Versuch, die Schwerkraft aufzuheben. Der Datenverkehr im Internet fußt nun einmal auf der Verwendung von IP-Adressen. Genau so essenziell wie es die Zuweisung einer festen IP-Adresse für einen Server im Internet ist, benötigt auch jeder Client-Rechner eine IP-Adresse, damit er überhaupt das WWW „durchforsten“ kann. Und eben diese IP-Adressen der Client-Rechner werden beim Besuch einer Webseite vom Server selbst protokolliert.

Urchin bietet nun mit wenigen Klicks die Möglichkeit, über eine einfache Filtersetzung  IP-Adressen zu anonymisieren. Dabei kann der Administrator entscheiden, ob entweder nur das letzte Oktett der IP-Adresse unkenntlich gemacht oder die ganze IP-Adresse z.B. mit 127.0.0.1 überschrieben werden soll.

Weitere datenschutzrechtliche Bedenken ausgeräumt

Der Einsatz von Urchin räumt auch weitere Bedenken in Bezug auf den Datenschutz aus:

  • Durch den Betrieb von Urchin und dem Vorhalten, Verarbeiten und Auswerten auf ausschließlich eigenem Equipment  des Website-Betreibers bleiben die Daten grundsätzlich in Deutschland bzw. Europa.
  • Der Website-Betreiber kann sicherstellen, dass kein Unbefugter Zugriff auf die Daten nehmen kann, da Urchin ein ausgefeiltes Konten-, Nutzer- und Gruppenmanagement bietet.
  • Durch passende Filtersetzung können jederzeit IP-Adressen (bereits vor der Anonymisierung) von der Datenverarbeitung ausgeschlossen werden.
  • Datenbestände innerhalb von Urchin können mit wenigen Mausklicks gelöscht werden.

Fazit

Urchin bietet als käufliches Pendant zu Google Analytics alle Möglichkeiten der professionellen Webanalyse. Neben einem umfänglichen Feature-Set, das kaum Wünsche offen lässt, bietet Urchin auch im Gegensatz zu Google Analytics die Möglichkeit, historische Datenbestände zu analysieren. Durch die Auswertung lokaler Protokolldateien (Logfiles) ist mit Urchin endlich datenschutzkonformes Tracking realisierbar; die Diskussion bezüglich Datenschutz kann somit erst gar nicht aufkommen.

2 Kommentare zu „Datenschutzkonforme Webanalyse mit Urchin 7“

  • Hi Holger
    Danke für den Blogbeitrag, echt spannend. Du nimmst hier die Datenschutzrichtlinien für Deutschland in Kombinatiin mit Urchin genauer unter die Luppe. Mich würde hier eine Analyse bzw. Einschätzung betreffend schweizerischen Datenschutzrichtlinien sehr interessieren, hast du hiermit Erfahrung? Würde mich über deine Einschätzung freuen.
    Internette Grüsse aus der Schweiz.

    Florian

  • Hallo Florian,

    gerne kann ich den Check auch für die schweizerischen Datenschutzbestimmungen durchführen. Dazu benötige ich ein Exemplar davon. Wo finde ich ein solches?

    Holger Tempel

Kommentieren

Follow us:
Abonnieren Sie unseren Blog!
Folgen Sie uns auf Twitter!
Folgen Sie uns auf Facebook!
Folgen Sie uns auf LinkedIn!
Feedburner-Abo
RSS Feed für Reader abonnieren

oder geben Sie Ihre E-Mail-Adresse an:

Kategorien
Archive