Zugriffsstatistiken.

Gestern habe ich mich endlich wieder einmal um die Webstatistiken von netplanet (also sowohl von den Lexikonseiten, als auch von diesem Blog) gekümmert und das aktuelle Release des Webalizer-Forks von Stone Steps heruntergeladen und installiert. Stone Steps ist eine kleine, kanadische Firma, die sich vor Jahren erbarmt hat, den damals brachliegenden Code des originalen Webalizers aufzuräumen und weiter zu entwickeln. Und das ist ihnen auch gelungen, denn dieser Fork ist der beste und gepflegteste von allen und übertrifft den originalen Webalizer, der nun seit letztem Dezember auch wieder gelegentlich gepflegt wird, um Universen.

Nachdem das getan war, habe ich der frischen Installation mal meinen Bestand an alten netplanet-Logfiles zum Fressen daherdrapiert und nach rund zwei Stunden waren fünf Jahre netplanet-Zugriffe von Lexikon und knapp zwei Jahre Zugriffe dieses Blogs verwurstet. Der alte Käse ist dabei gar nicht so interessant, eher erschüttert haben mich die aktuellen Werte der letzten Monate. In der Zwischenzeit ist es nämlich so, dass das Blog in praktisch allen Vitalwerten das Lexikon schon längst hinter sich gelassen hat. Hier mal die Werte vom März 2009 im direkten Vergleich:

Lexikon Blog
Hits 1.017.000 680.000
Pageimpressions 72.300 176.000
Übertr. Dateien 933.000 630.000
Datenverkehr 2,7 GB 6,5 GB

Die höhere Zahl von Hits und übertragenen Dateien vom Webserver des Lexikons ergeben sich durch den Umstand, dass eine Lexikonseite deutlich mehr Grafikelemente lädt, als im Blog. Das könnte man sicherlich optimieren, wenn ich mich endlich mal dazu aufraffen würde, das Lexikon auf ein CMS umzustellen.

Ein Gedanke zu „Zugriffsstatistiken.

  1. Das Problem bei solchen Statistiken ist naturgemäß, dass sie auch Suchmaschinenspider („unbekannte“ jedenfalls) und ganz wichtig auch SPAM-Robots zählt.

    Blogs werden, aufgrund ihrer häufigen Änderungen erheblich öfters abgespidert als normale Websites. Außerdem sind sie auch erheblich beliebter bei SPAM-Robots, vor allem denjenigen, die versuchen, irgendwelche Trackbacks zu setzen oder Kommentare.

    Alleine der Umstand, dass im Lexikon keine Formulare sind, hält solche Robots ab.

    Die Zahlen lassen sich so damit leider nicht vergleichen. Davon abgesehen, dass mittlerweile durch diese ganzen Robots _absolute_ Zahlen zu Statistiken nicht mehr taugen. Du schaust ja auch nicht auf Deinen Mailserver, zählst blind alle Mails, die an Deine Adresse gehen und sagst „ich bekomme pro Tag 5.000 Mails, ich bin beliebt“ 🙂

    Womit man ein besseres (natürlich auch niemals perfektes) Ergebnis bekommt, sind Statistiktools, die mit Trackingpixel arbeiten, d.h. auf der Seite wird eine 0x0 Pixel große Grafik geladen, die in Wirklichkeit ein serverseitiges Skript ist, das Informationen über den Besucher sammelt. Damit kann man nebenbei auch vernünftig Sessions tracken und muss nicht Annahmen machen wie „ein Besuch endet, wenn jemand 15 Minuten nicht geklickt hat“.

    Es gibt eine ganze Menge kostenpflichtiger Tools und vor allem Tools, die nicht auf dem eigenen Server liegen (wie Google Analytics). Es gibt aber sehr gute Gründe, das auf seinem eigenen Server zu belassen. Dafür empfehle ich bspw. Piwik (http://piwik.org/).

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.