Den Artikel 718 weiterempfehlen
E-Mailadresse
 
Suche
FAQ finden
Produktkategorie: Hosting
Artikel ID: 718
Aktualisiert am: 25.04.2013

So erfahren Sie, wie oft Ihre Internet-Seiten besucht worden sind


Sicher wollen Sie genau wissen, wie oft und von wem Ihre Internet-Seiten aufgerufen worden sind. Wir stellen Ihnen in allen Hosting-Paketen ab dem Paket PowerWeb Basic (2013) (ältere Pakete: ab BasicWeb XL) dazu eine ausgewertete Abrufstatistik sowie Logfiles zum Download zur Verfügung:

Nützliches Hintergrundwissen:
Ein Webserver protokolliert jeden einzelnen Zugriff auf ein Element (z. B. eine HTML-Datei oder ein Bild) innerhalb Ihrer Webpräsenz. Auch gescheiterte oder verweigerte Zugriffe (z. B. wg. Passwortschutz) werden notiert. Der Server schreibt in ein so genanntes "Logfile", von welcher Domain aus der Zugriff erfolgte, zu welcher Zeit und welches Element (z.B. welche Seite oder welches Bild) abgerufen wurde. Unser Server protokolliert auch, mit welchem Browser das Element abgerufen wurde.

Aus datenschutzrechtlichen Gründen werden in den Logfiles der Hostname bzw. die IP-Adresse des Clients, der Ihre Website aufruft, anonymisiert. In den Logfiles werden nur die Einträge für den Host des Clients oder, wenn dieser nicht ermittelbar ist, die IP-Adresse des Clients anonymisiert. Das Format aller anderen Einträge ändert sich nicht.

Die ersten 9 Bit der IP-Adresse des Eintrags werden in einen Hash-Wert umgewandelt.So könnte aus der IP-Adresse 123.123.123.123 die "anonyme" IP-Adresse 123.123.122.243 werden. Eine  anonymisierte IP-Adresse behält maximal 24 Stunden ihre Gültigkeit. Danach würde aus derselben Ausgangs-IP-Adresse eine andere "anonyme" IP-Adresse werden.

Beispiel für Hostname-Anonymisierung:
Steht im Logfile ein Hostname, bleibt der Domainanteil erhalten. Alles andere wird durch die Zeichenfolge "anon-123-123-122-243.domain.tld" ersetzt. Die Zeichenfolge "anon" steht dabei für "anonym". Die Zifferngruppen stellen die anonymisierte IP-Adresse dar.

aus:
ascend-tk-p66.rhrz.uni-berlin.de - - [15/Jan/2008:12:28:23 +0100] "GET /Urlaub-mit-mir.gif HTTP/1.1" 200 8032 "http://www.wunschname-1.de/urlaub/ibiza.html" "Mozilla/5.0 .... usw ....

wird:
anon-123-123-122-243.uni-berlin.de - - [15/Jan/2008:12:28:23 +0100] "GET /Urlaub-mit-mir.gif.gif HTTP/1.1" 200 8032 "http://www.wunschname-1.de/urlaub/ibiza.html" .... usw ...

Man kann daraus die Informationen entnehmen, dass von einem Server der Uni Berlin am 15. Januar 2008 um 12.28 Uhr mit einem Mozilla-Browser Version 5.0 ein Zugriff auf die Seite "ibiza.html" im Ordner "urlaub" erfolgte. Die Angabe zur IP-Adresse, der Ihre Webseite aufgerufen hat, bleibt jedoch anonymisiert.

Beispiel für nicht auflösbare IP-Adressen:
Steht im Logfile eine IP-Adresse, weil kein Hostname aufgelöst werden konnte, wird ein Hostname nach folgendem Schema erzeugt: "anon-123-456-165-41.invalid". Auch hier steht die Zeichenfolge "anon" für "anonym" und die Zifferngruppen stehen für die anonymisierte IP-Adresse. Die Top-Level-Domain ".invalid" wird angehangen, weil sie niemals als echte TLD vergeben wird und für derartige Einsatzzwecke vorgesehen ist.

aus:
123.456.789.001 - - [15/Jan/2008:12:28:23 +0100] "GET /Urlaub-mit-mir.gif HTTP/1.1" 200 8032 "http://www.wunschname-1.de/seite.htm" "Mozilla/5.0 .... usw ....

wird:
anon-123-456-165-41.invalid - - [15/Jan/2008:12:28:23 +0100] "GET /Urlaub-mit-mir.gif HTTP/1.1" 200 8032 "http://www.wunschname-1.de/seite.htm" "Mozilla/5.0 .... usw. ....

In diesem Beispiel kann man die Informationen entnehmen, dass der Aufruf von einem Server kam, der sich innerhalb der IP-Range 123.456.000.01 bis 123.456.255.99 befindet. Die genaue Angabe um welche spezifische IP es sich gehandelt hat bleibt jedoch auch hier anonymisiert.

Wichtige Grundbegriffe
Die wichtigsten Begriffe im Zusammenhang mit den Statistiken sind Zugriffe (englisch Hits) und Seitenabfragen (englisch Page Views).

Die Zahl der Zugriffe/Hits gibt an, wie oft Anfragen auf Ihre Internet-Präsenz gestellt worden sind. Jede Seite, aber auch jedes Bild wird als ein Zugriff gezählt. Wenn Sie also eine Seite mit 5 Bildern und einer hinterlegten Musik (z.B. Midi-Datei) haben, werden 7 Zugriffe (1 Seite + 5 Bilder + 1 Musik-Datei) erzeugt. Auch Anfragen nach Seiten, die nicht existieren, oder Seiten, bei denen der Zugriff verweigert wurde, werden als Hit gezählt.

Der Begriff Page Views dagegen beschreibt nur die Seitenabrufe (d. h. wie oft HTML- und TXT-Dateien abgerufen worden sind). Die genannte Seite mit Bildern und Musikdatei erzeugt nur einen Seitenabruf/Page View. Nicht erfolgreiche Anfragen werden hier nicht mitgezählt. Wenn Sie Ihre eigenen Zugriffsstatistiken also mit anderen vergleichen wollen, sollten Sie immer die richtigen Werte miteinander in Bezug setzen. Wenn Sie von anderen eine sehr hohe Zahl hören, etwa mehrere Tausend Abrufe im Monat, handelt es sich sehr oft nur um Zugriffe/Hits. Diese können jedoch nur sehr bedingt Auskunft über die Attraktivität einer Internet-Präsenz geben, da die Zahlen schnell sehr groß werden, wenn viele Bilder und Frames verwendet werden. Wenn Sie wissen wollen, wie intensiv Ihr Online-Angebot von den Internet-Nutzern angenommen wird, ist es besser, die Zahl der Seitenabrufe/Page Views heranzuziehen.

Bitte beachten Sie, dass sich maximal 400 Tage darstellen lassen können.


Generell müssen Sie bei den Zugriffszahlen eine gewisse Verzerrung einkalkulieren. Diese entsteht vor allem durch so genannte Proxy-Server wie sie z. B. von Online-Diensten eingesetzt werden. Proxy-Server werden verwendet, um alle angefragten Internet-Dokumente und Grafiken zwischenzuspeichern, so dass die nächste Abfrage einer Seite nicht mehr neu aus dem Internet geholt werden muss, sondern direkt aus dem lokalen Speicher (Proxy-Server) des Providers. Dies geht wesentlich schneller. Dadurch, dass die Datei nicht mehr von unserem Server direkt angefragt wird, kann allerdings auch kein Zugriff protokolliert werden. Diese Leser sind für Sie also sozusagen unsichtbar. Die "wirklichen" Zugriffszahlen Ihrer Website können also wesentlich höher sein, als die Logfiles vermuten lassen.

Umgekehrt verzerren Indizierungsroboter der Suchmaschinen Ihre Statistik ins Positive. Stichwort-Suchmaschinen benutzen kleine Programme ("Bots"), die Ihre gesamte Internet-Präsenz aufrufen und in die Suchmaschinen-Datenbank einlesen. Dadurch erhalten Sie protokollierte Zugriffe, die jedoch nicht durch einen wirklichen Leser erfolgen.

Weitere Begriffe rund um Abrufstatistiken
Neben den genannten Grundbegriffen Hits und Page Views zeigt Ihnen unsere Abrufstatistik noch einige weitere Größen an:

Files, (Dateien)
gibt an, wie viele Dateien erfolgreich abgerufen worden sind. Jede Internet-Seite, jedes Bild und jede andere abrufbare Datei (z. B. Midi-Datei, Video-Sequenz) wird als ein "File" gezählt. Die Beispielseite mit 5 Bildern und einer hinterlegten Musik wird als 7 Files gezählt (1 Seite + 5 Bilder + 1 Musik-Datei).

Code 304 (not modified)
Bei jedem Abruf einer Internet-Seite überprüft der Browser (je nach Cache) zuerst, ob er die Seite noch im eigenen Zwischenspeicher (Cache) hat. Wenn ja, vergleicht er, ob das Dokument auf dem Server aktueller ist. Nur in diesem Fall holt er es auch wirklich vom Server ab.

Ist es nicht aktueller, wird die Seite aus dem Cache geholt und muss nicht übers Netz übertragen werden. Der gleiche Vorgang findet bei Providern statt, die Proxy-Server einsetzen.

Der Server protokolliert diese Anfrage, bei der die gewünschte Datei nicht übertragen wurde, weil sie lokal noch vorhanden war, mit dem Code 304.

Sessions, auf deutsch Sitzungen
gibt an, wie viele unterschiedliche Domains auf Ihre Internet-Präsenz zugegriffen haben. Greift eine Domain erneut auf Ihre Internet-Präsenz zu, wird dies innerhalb eines Tages nicht als neue Session gewertet.

Die Anzahl der "Sessions" lässt bedingt Rückschlüsse auf die Anzahl der Besucher zu. Dadurch, dass bei großen Providern der Zugriff über einen Proxy-Server erfolgt und manche Besucher innerhalb eines Tages mehrmals auf Ihre Internet-Seiten zugreifen, muss dabei eine gewisse Verzerrung einkalkuliert werden.

Kilobytes
gibt an, wie viel Transfervolumen die abgerufenen Dateien verursacht haben. Eine Beispielseite mit einer Dateigröße von 14 Kilobyte (KB) sowie 5 Bildern á 10 KB verursacht 64 KB Transfervolumen. Unsere Statistik gewährt Ihnen überdies Aufschluss über :
  • Die Browser ("Browser type") mit denen Ihre Internet-Präsenz am häufigsten aufgerufen wurde.
  • Die Seiten, von denen aus ein Benutzer auf Ihre Seiten gelangt ist (so genannte "Referrer URL")
  • Die Domain, von der aus auf die Seiten zugriffen worden ist (so genannte "Client Domain"). Diese Domain gibt in der Regel den Zugangsprovider an, z. B. AOL
  • Über die am häufigsten abgerufenen Seiten ("URLS") bzw. Elemente ("Items", also z.B. Bilder, CGI-Scripte)
Die vorgenannten Daten sind wichtige Informationen zur Weiterentwicklung Ihrer Internet-Präsenz. Je nach Verteilung der zugreifenden Browsertypen kann es zum Beispiel sinnvoll sein, bestimmte HTML-Erweiterungen, die nur von einzelnen Browsertypen angezeigt werden können, zu verwenden oder deren Verwendung einzustellen.

Die "Referrer URL" ist eine interessante Informationen darüber, wie Ihre Besucher auf Ihre Internet-Präsenz aufmerksam geworden sind. Fehlen hier große Suchmaschinen, könnte dies ein Hinweis für Sie sein, Ihre Anmeldung dort zu überprüfen oder Ihren Eintrag zu optimieren.

Die "Client Domain" schließlich kann Rückschlüsse darüber ermöglichen, aus welchen Ländern Ihre Betrachter auf Ihre Internet-Seiten zugreifen.

Die Hitliste der am meisten abgerufenen Seiten bzw. Elemente sagt Ihnen, was Ihre Betrachter besonders gerne mögen. Diese Rückmeldung zeigt, wo Ausbaupotentiale Ihrer Internet-Präsenz liegen und welche Bereiche nicht so gut ankommen und vielleicht verbessert werden müssen.


A) Nutzung der ausgewerteten Zugriffsstatistiken
Gehen Sie auf unserer Website in den passwortgeschützten Kundenlogin. Sie erhalten dann links ein Kontextmenü, in dem Sie bitte den Menüpunkt Statistik anklicken. Sie erhalten eine Übersicht der wichtigsten statistischen Auswertungsparameter in einer graphischen Darstellung.


In der Tabelle sind die verschiedenen statistischen Angaben für Ihre Internet-Präsenz nach frei wählbaren Zeiträumen aufgeschlüsselt. Mit einem Klick auf die jeweiligen Optionen können Sie weitere Detailinformationen abfragen:

Über die Zeile Hits/Files erhalten Sie eine Einzelauswertung der erfolgten Zugriffe für den gesamten Monat aufgeschlüsselt nach Abfragezeitpunkt. Dies kann zum Beispiel folgendermaßen aussehen:



Über die Zeile Items/URLs erhalten Sie bei Klick auf die Option eine Grafik der am häufigsten abgerufenen Seiten Ihrer Internet-Präsenz.


Über die Zeile Client Domain erhalten Sie bei Klick auf die Option eine Grafik der Domains, die am häufigsten auf Ihre Internet-Präsenz zugegriffen haben.


Über die Zeile Browser erhalten Sie bei Klick auf die Option eine Grafik der am häufigsten zugreifenden Browser.


Die Abkürzung "MSIE" steht dabei für Microsoft Internet Explorer, der Begriff "Mozilla" in der Regel für den Firefox. Die Zahlen dahinter geben die jeweilige Versionsnummer an.

Über die Zeile Referrer URL erhalten Sie bei Klick auf die Option eine Grafik der Domains, von denen aus am häufigsten auf Ihre Internet-Präsenz verwiesen worden ist.


Hier werden Sie in der Regel viele Suchmaschinen finden.


B) Nutzung der Original Logfiles
Wenn Sie die unausgewerteten Original-Zugriffsstatistiken ("Logfiles") benötigen, können Sie dieseüber den Reiter Logfiles herunterladen. Es stehen dabei alle Termine zur Verfügung, an denen in den letzten 6 Wochen Zugriffe auf Ihre Internet-Präsenz erfolgten.

Wenn Sie nur einzelne Domains oder Subdomains auswerten möchten wählen Sie die Option über den Radiobutton.




Nun erhalten Sie die von Downloads bekannte Dialogbox des Browsers, in der Sie festlegen, wie die Datei heißen soll und wohin sie gespeichert werden soll. Speicherort und -name sind frei wählbar. Als Dateiendung sollten Sie jedoch .gz beibehalten.

Um die Datei anschließend zu betrachten, muss sie zuerst entkomprimiert werden. Damit Sie die Daten schneller herunterladen können, werden sie von uns nämlich automatisch im .gz-Format abgelegt. Dies ist ein verbreitetes Kompressionsformat ähnlich wie .zip. Um die Datei lesen zu können, müssen Sie diese mit einem entsprechenden Entpack-Programm wieder dekomprimieren. Gängige Programme wie zum Beispiel WinZip können die Datei problemlos verarbeiten. Wenn Sie noch keins dieser Programme installiert haben, werden Ihnen unterhalb des Links zum Logfile-Download auch Links zu entsprechenden Programmen angeboten.

Wir zeigen Ihnen im folgenden den manuellen Dekomprimierungsvorgang anhand von WinZip. Die Handhabung ist in anderen Komprimierungsprogrammen vergleichbar.

Wenn Sie WinZip installiert haben, müssen Sie nur doppelt auf die Logfile-Datei klicken und das Programm öffnet diese automatisch.


Unter Umständen öffnet sich dabei eine Zusatz-Dialogbox wie in obiger Abbildung, in der Sie nach der Dateiendung der enthaltenen Logfile-Datei gefragt werden. Geben Sie dazu wie im obigen Beispiel .txt ein. Wenn Sie Microsoft-Word oder Wordpad installiert haben, können Sie auch .doc eingeben. Klicken Sie anschließend auf den OK-Button.
Sie sehen die Datei nun in der Übersichtsliste von WinZip.


Klicken Sie auf das Feld Extract in der Werkzeugleiste. Sie erhalten dann ein Dateiauswahlfenster, in dem Sie festlegen können, wo Sie die entkomprimierte Logfile-Datei auf Ihrer Festplatte ablegen wollen. Der Ort ist frei wählbar. Klicken Sie anschließend auf den Button Extract, um die Datei dort zu speichern.


Sie können WinZip nun schließen und die Logfile-Datei mit dem gewünschten Programm weiterverarbeiten, z. B. mit Auswertungsprogrammen (so genannte "Logfile-Analyzer"). Manche Logfile-Analyzer können sogar komprimierte Dateien verarbeiten. In diesem Fall können Sie sich den geschilderten Entkomprimierungsvorgang mit WinZip natürlich auch ersparen.

Außerdem können Sie die Datei in jedem Programm betrachten, das Texte anzeigen kann, z.B. in dem mit Windows mitgelieferten Wordpad oder in Microsoft Word.
In Wordpad sieht dies dann zum Beispiel so aus:



Wenn Sie die Datei nicht als ".doc" gespeichert haben, müssen Sie beim Öffnen am Fuß der "Öffnen"-Dialogbox im Aufklappmenü "Dateityp" die Option "Alle Dokumente" auswählen.


Anschließend können Sie die logfile.txt wie gewohnt öffnen.