Worum geht es?

Aus technischen Gründen ist es an einigen Stellen notwendig, die Anzahl der erfassbaren Daten einzuschränken. Dafür wird bei einigen Dimensionen mit Mapping-Tabellen gearbeitet, die eine maximale Größe erreichen können. Die sich wiederholenden Werte werden hierbei nicht mit jedem Request erneut in der Datenbank gespeichert, sondern über eine Mapping-Tabelle referenziert. Dadurch wird u.a. die Analyse-Berechnung deutlich beschleunigt.

Dies betrifft viele Standarddimensionen, wie etwa Seiten, Produkte, Suchphrasen, Medien oder Aktionen sowie die meisten Arten von eigenen Parametern. Generell geht es hierbei immer um Text-Werte, Zahlen unterliegen keinerlei Beschränkung.

Beispielsweise gibt es ein Limit der Seiten, welches standardmäßig bei 5 Mio. Stück liegt, allerdings abhängig von Ihrem Vertrag ist. Das heißt, dass im Account maximal 5 Mio. unterschiedliche Seitennamen erfasst werden können.

Erreicht ein solches Mapping-Limit 100 %, werden keine neuen Ausprägungen mehr erfasst. Stattdessen landen diese Aufrufe im Wert "webtrekk_fallback“. Bei Parameter-Limits gilt dies für alle Parameter der betroffenen Art, auch wenn nur ein bestimmter Parameter gerade hauptsächlich für das Erreichen des Limits verantwortlich ist.

Auf die bereits bekannten Werte hat dies hingegen keine Auswirkung, sie werden weiterhin gemessenen.

Dazu ein Beispiel: Die Tabelle der Seiten-Parameter (cp) ist vollgelaufen. Ein User macht drei Page Impressions auf Seite A, Seite B und Seite C und sieht dabei cp1=x, cp2=y und cp3=z. Der Wert “x“ wurde vorher schon einmal gemessen und steht in der Seiten-Parameter-Mapping-Tabelle. Die Werte der anderen beiden Seiten-Parameter “y“ und “z“ sind hingegen neu. In dem Fall werden drei Page Impressions gemessen sowie der Wert “x“ für cp1 und der Wert "webtrekk_fallback" für cp2 und cp3. Die Mapping-Tabelle kann keine neuen Werten aufnehmen und ordnet diese daher "webtrekk_fallback" zu.

Deshalb sollte darauf geachtet werden, dass immer Platz in den Mapping-Tabellen vorhanden ist.

Was passiert bei der Bereinigung?

Um wieder Platz für neue Ausprägungen zu schaffen, kann Ihr Mapp Ansprechpartner eine automatische Bereinigung durchführen. Das Ziel sind dabei die "unwichtigen" Werte, welche verhältnismäßig selten gemessen wurden. Diese werden bei der Bereinigung mit dem Wert "webtrekk_aggregated“ überschrieben. Die ursprünglichen Werte entfallen dadurch und schaffen Platz für Neue.

Anschließend lässt sich in der Analyse also nicht mehr sagen, welcher Wert gemessen wurde, da dieser auf "webtrekk_aggregated“ umgemappt wurde. Die Messung an sich (im Beispiel der Seite die Page Impression) ist aber weiterhin vorhanden.

"webtrekk_aggregated“ ist auch im Rohdatenexport enthalten, wenn dieser für den bereinigten Zeitraum erneut durchgeführt wird.

Die Bereinigung hat nur Auswirkungen auf die jeweilige Parameterart. Alle anderen Daten bleiben unverändert.

Wie lässt sich die Stärke der Bereinigung steuern?

Sie können mit zwei Faktoren festlegen, wie umfangreich die Bereinigung sein soll. Zunächst wird die Anzahl der Referenzen festgelegt, z.B. 5. Das bedeutet, es werden alle Ausprägungen zusammengefasst ("webtrekk_aggregated"), die insgesamt maximal 5 Mal gemessen wurden. Je höher die Referenzen gewählt werden, umso mehr Ausprägungen fallen darunter und umso mehr Platz wird geschaffen.

Als zweiter Faktor lässt sich die Anzahl der Monate einstellen, die geschützt werden sollen. Dadurch bleiben die jüngsten Daten unangetastet. Ein Monat entspricht dabei 30 Tagen. Werden bei einer Bereinigung also 2 Monate geschützt, bleiben vom Tag der Bereinigung aus rückwirkend 60 Tage verschont. Je höher die Anzahl der Monate, umso weniger Ausprägungen kommen für die Bereinigung in Frage und umso weniger Platz wird geschaffen.

Was sind tote Mappings?

Wird ein Parameter in der Konfiguration gelöscht, entstehen sogenannte tote Mappings. Der Parameter kann somit nicht mehr analysiert werden. Jedoch stehen seine Werte weiterhin in der Mapping-Tabelle, ohne einen Bezug zu haben. Auch bei der automatischen Löschung von Rohdaten, welche die eingestellte Datenhaltungszeit in Ihrem Account überschritten haben (z.B. 14 Monate), entstehen tote Mappings. Diese Ausprägungen können ebenfalls durch die Bereinigung gelöscht werden.

Dies hat keine Auswirkungen auf die im Account enthaltenen Daten und somit auch nicht auf die Analysen und Reports. Denn es betrifft nur Daten, die auf Grund der gerade genannten Möglichkeiten zu toten Einträgen geworden sind und keinen Bezug mehr zu den Daten in der Datenbank haben.

Es ist auch möglich, bei einer Bereinigung nur die toten Mappings zu entfernen, ohne Referenzen und Monate anzugeben. Die Wirkung ist hierbei jedoch geringer.

Was ist noch zu berücksichtigen?

Die Parameter-Limits gelten immer pro Datenaccount und Parameterart, daher erfolgt auch die Bereinigung immer für alle Parameter einer Sorte, einzelne Parameter lassen sich nicht bereinigen.

Die Bereinigungen müssen bis 18 Uhr von Ihrem Mapp-Ansprechpartner eingestellt werden, damit sie bei dem täglichen Prozess ausgeführt werden. Anschließend stellen wir Ihnen das Ergebnis zur Verfügung.

Ihr Mapp Ansprechpartner informiert Sie aktiv, sollte sich ein Limit Richtung 100 % bewegen. Optional gibt es auch automatische Benachrichtigungen per E-Mail, welche für Sie eingestellt werden können.


Ebenfalls können wir Ihnen eine Übersicht zur Verfügung stellen, welche die Anzahl der gemessenen Werte pro Parameter enthält. Denn oftmals gibt es einen bestimmten Parameter, der das Limit am meisten ausfüllt. Je individueller die Werte pro User, Session oder Aufruf sind, umso schneller wird das maximale Limit erreicht.

Ist dies regelmäßig der Fall, sollte ggfs. konzeptionell die Implementierung überarbeitet werden. Wenn Sie die Daten nicht im derzeitigen Detailgrad brauchen, sollten diese allgemeiner gestaltet werden.

Welche Limits lassen sich nicht automatisch bereinigen?

Auch Kategorien arbeiten mit Mapping-Limits, hierzu zählen beispielsweise Contentgruppen, Produktkategorien oder URM-Kategorien. Eine normale automatische Bereinigung ist hier aus technischen Gründen leider nicht möglich. Lediglich die toten Mappings lassen sich bereinigen. Hierbei kann es auch hilfreich sein, eine obsolete Kategorie vorher zu löschen, um zusätzliche tote Mappings zu erzeugen.

Weiterhin lassen sich mit Hilfe des Ex- und Imports Kategorie-Werte manuell löschen. Hierbei muss anschließend eine Bereinigung der toten Mappings erfolgen, um die gelöschten Werte für das Limit verfügbar zu machen. Bei der Löschung werden Werte aus den entsprechenden Zellen in der Excel-Tabelle gelöscht und diese leer wieder hochgeladen. Dies kann in Q3 innerhalb der Konfigurationsmaske der Kategorien erfolgen oder über einen Feed, welcher auch ohne Zeilenlimit arbeitet.

Ebenso können Kampagnen/Werbemittel nicht automatisch bereinigt werden. Daher sind diese manuell zu deaktivieren. Eine Anleitung dazu finden Sie hier.

Bei Kategorien und Kampagnen gibt es kein "webtrekk_fallback".

Welche Alternativen gibt es?

Eine Alternative zur Bereinigung ist eine Anhebung des Limits. Dies ist in der Regel kostenpflichtig und kann mit Ihrem Ansprechpartner bei Mapp abgestimmt werden.

Neben der oben genannten konzeptionellen Anpassung ist eine weitere Möglichkeit die Nutzung eines generischen Parameters, welcher keiner Limitierung unterliegt. Denn seine Werte werden direkt in die Datenbank geschrieben anstatt in die Mapping-Tabelle und fallen daher nicht ins Limit. Die generische Eigenschaft kann für jeden Parameter in der jeweiligen Konfiguration eingestellt werden. Jedoch ist die Anzahl dieser Art limitiert. Als Beispiel ist die Google-Click-Id zu nennen, welche als generischer Kampagnen-Parameter keine Limitierungsprobleme verursacht.

Die Umstellung eines bestehenden Text-Parameters auf generisch wird durch die Mapp-IT auf Anfrage durchgeführt. Dabei bleiben alle Daten erhalten, es ändert sich aber der Spaltenname im Rohdatenexport, beispielsweise von "CUST_PARA_STRING_3" zu "CUST_PARA_GENERIC_3". Dies muss evtl. bei der Weiterverarbeitung der Rohdaten berücksichtigt werden.

Die einzige Einschränkung besteht daran, dass generische Parameter leider nicht zur Darstellung als Live-Kennzahl genutzt werden können.

Fazit

Da von einer Bereinigung in der Regel nur Werte betroffen sind, die selten gemessen wurden, ist das Thema meist unkritisch. Für Analysen sind diese häufig nicht relevant, es gehen also keine wichtigen Informationen verloren. Kritisch wäre dagegen, auf die Bereinigung zu verzichten und dadurch neue Werte nicht messen zu können.

Wenn Sie Ihre Rohdaten regelmäßig exportieren, haben Sie auch die ursprünglichen Daten weiterhin in Ihrem DWH.


Weitere Informationen

Was bedeutet "webtrekk_fallback"?

Was bedeutet "webtrekk_aggregated"?

Wie kann ich die Zahl meiner aktiven Kampagnen reduzieren?