Referrer Spam in Google Analytics ausschließen

Kategorie: Technologie, Web Controlling

Referrer Spam in Google Analytics ist leider keine Seltenheit mehr. Haben Sie schon einmal kuriose Verweis-URLs in Ihrem Konto entdeckt? In unserem Artikel erfahren Sie, wie Sie Referrer Spam ausschließen und endlich wieder reine Daten bekommen können.

Was ist Referrer Spam und woher stammt er?

Als Referrer Spam bezeichnen wir Eintragungen im Bereich “Verweise”, die durch einen Bot erzeugt werden. Die Zugriffe haben das Ziel, Sie zu Besuchen auf einer Spam-Website zu verleiten.

Typischer Referrer Spam

Typischer Referrer Spam

Die meisten dieser Besuche sind niemals über Ihre Website entstanden, sondern werden über das Google Measurement Protocol direkt in Google Analytics eingetragen. Das Measurement Protocol ist eine Schnittstelle zu Google Analytics, die eigentlich der Anreicherung von Daten dienen soll. Leider ist diese Schnittstelle aber kaum nach außen abgesichert und bietet so auch schadhaften Zugriffen eine Möglichkeit, Ihre Analysewerte zu beeinflussen.

Unser Ziel ist nun also, die Zugriffe der Spam-Bots auszuschließen, bzw. deren Eintragungen auszufiltern. Damit erhalten wir wieder unsere “reinen” Daten, ohne jegliche Werbeeintragungen.

Option 1: Filter setzen

Im Web findet man immer wieder den Hinweis, man solle einen Filter inkludieren, der den Hostname auf die eigene Domain einschränkt. Dies schränkt eine kleine Anzahl an Bots aus, die über einen anderen Host auf unsere Website zugreifen.

Der Großteil der Bots umgeht jedoch diese Praxis. Mithilfe des Measurement Protocols lässt sich auch der Hostname setzen, die Zugriffe der Bots sind also nicht mehr von den Zugriffen unserer normalen, menschlichen Besucher zu unterscheiden. Diesen Großteil der Bots würde ein reiner Filter des Hostnames also nicht aufhalten.

Wir präferieren deshalb Option Nummer 2.

Option 2: Einschließen über Cookie

Wir setzen in unserem Beispiel auf den Google Tag Manager zur Aussteuerung von Google Analytics. Dies vereinfacht das Setzen von Variablen und Einstellungen. Natürlich ist die Vorgehensweise aber auch ohne den Google Tag Manager umsetzbar.

Schritt 1: Benutzerdefinierte Dimension in Google Analytics anlegen

Benutzerdefinierte Dimension anlegenZuerst benötigen wir in Google Analytics eine benutzerdefinierte Dimension. Hierzu wechseln wir in Google Analytics unter Verwaltung zu Property -> Benutzerdefinierte Dimensionen. Hier fügen wir eine neue Dimension mit dem Namen “Spam Key” und dem Umfang “Hit” hinzu.

Wichtig: Index-Nummer der Dimension merken.

Schritt 2: Einstellungen im Google Tag Manager

Nun wechseln wir zum Google Tag Manager und erstellen einen neuen HTML-Tag mit einem Cookie.

See the Pen Anti-Spam-Cookie setzen by MSO Digital (@msodigital) on CodePen.

Anti-Spam-Cookie setzen

Diesem geben wir einen eindeutigen Wert und ein Ablaufdatum (weit) in der Zukunft. Name und Wert des Cookies sind dabei frei wählbar und haben keinen Einfluss auf das Endergebnis, der Cookie dient später lediglich dem Filtern der ungewünschten Anfragen. In unserem Beispiel haben wir einen Cookie mit dem Namen “antispam2017” und dem Wert “42” erstellt.

Cookie-VariableAls nächstes speichern wir uns den Cookie als Variable im Tag Manager, um einfacher auf ihn zugreifen zu können. Hierzu wechseln wir zum Bereich “Variablen” und erstellen einen neuen First-Party-Cookie. Diesem geben wir den Namen unseres Cookies, in unserem Beispiel “antispam2017”.

Hiermit können wir nun über den Ausdruck {{antispam2017}} innerhalb des Google Tag Managers auf unseren Cookie referenzieren.

Schritt 3: Cookie mit benutzerdefinierter Dimension verknüpfen

Nun folgt der wichtige Teil: In unserem Universal Analytics Tag-Template ermöglicht uns der Google Tag Manager unter “benutzerdefinierte Dimensionen” unsere benutzerdefinierten Dimension aus Google Analytics dynamisch zu befüllen. Hier kommt die Index-Nummer der Dimension wieder ins Spiel. Diese wird im Feld unter “Index” eingetragen, während die Referenz auf unseren Cookie im Werte-Feld der Dimension ihren Platz findet.

Benutzerdefinierte Dimension im Universal Analytics Tag

Wir veröffentlichen das Ganze und – zack – hat es zur Folge, dass jedem PageView nun eine benutzerdefinierte Dimension mitgegeben wird. Bedeutet: Bei einem Aufruf unserer Seite setzt unser Tag Manager die benutzerdefinierte Dimension “Spam Key” mit dem gewählten Wert “42”.

Ein etwaiger Referral-Spammer weiß natürlich nicht, dass dieser Key existiert. Und da alle “erlaubten” PageViews über den Google Tag Manager ausgesteuert werden, wissen wir, dass jeder valide Zugriff den geheimen “Spam Key” bei sich tragen muss.

Schritt 4: Filter in Google Analytics erstellen

Um unsere Daten in Google Analytics zu säubern, müssen wir als letzten Schritt einen Filter in Google Analytics erstellen. Über diesen Filter sollen alle Nutzer eingeschlossen werden, bei deren Zugriff die benutzerdefinierte Dimension “Spam Key” den Wert “42” enthält.

Google Analytics Spam FilterDies wird am besten über einen “Einschließen”-Filter eingestellt. Hier könnt ihr eure benutzerdefinierte Dimension “Spam Key” wählen und die Zeichenfolge “42” in eure Datenansicht einschließen. Alles, was den “Spam Key” nun nicht hat, wird ausgeschlossen – somit auch unbeliebter Referral-Spam.

Selbst wenn der Spam nun euren Hostname mitsendet, werden keine Hits mehr an Analytics gesendet, da die kleine aber feine Dimension “42” nicht in diesen Measurement Protocol-Datenpaketen existiert. Wenn also jemand die Seite besucht, bekommt er den Cookie und wird getrackt. Wenn jemand die Seite nicht besucht, wird der Cookie entsprechend nicht gesetzt und die Daten werden nicht gemessen.