Hallo Leute, ich bin gerade dabei, Apache-Logfiles von 1&1 mit Webalizer auswerten zu lassen. Die Statistik ist ganz interessant, hat aber einen Haken: Ich bekomme nur URLs anstelle der UserAgents gemeldet. Die Frage ist jetzt: Wie bringe ich webalizer das Format der access.log bei? Die Zeilen im access.log sehen so aus: (# = Kommentar meinerseits) 12.34.56.78 #1 IP des Besuchers [1] - #2 ??? - #3 Benutzername [14/Apr/2002:21:55:09 +0100] #4 Datum/Zeit "GET /themen_main.php?lang=de HTTP/1.0" #5 HTTP-Request 200 #6 HTTP-Statuscode 1034 #7 übertragene Bytes (?) www.mydomain.tld #8 aufgerufene Domain [2] "http://www.domain.tld/regionen_de.php?lang=de" #9 Referrer "Mozilla/5.0 (compatible; Konqueror/2.2.1; Linux)" #10 Browserkennung "-" #11 ??? Ich rufe webalizer so auf: /usr/bin/webalizer -n "domain.tld" -o statistik-dir \ -x htm -M 0 -g 0 -A 50 -R 50 -S 50 -U 50 -C 50 -e 50 -E 50 -l 0 -N 0 \ logfile Gruß Christian Boltz [1] oder Domain, löse ich _vorher_ mit logresolve auf, bei Webalizer habe ich den DNS-Aufruf deaktiviert. [2] _Domain_, die der Besucher in der Adressleiste des Browsers eingegeben hat -- Registrierter Linux-Nutzer #239431 Linux - life is too short for reboots.
an Christian Boltz 's Tastatur wurde am Montag, 15. April 2002 20:34 folgendes notiert:
200 #6 HTTP-Statuscode 1034 #7 übertragene Bytes (?) www.mydomain.tld #8 aufgerufene Domain [2] "http://www.domain.tld/regionen_de.php?lang=de" #9 Referrer "Mozilla/5.0 (compatible; Konqueror/2.2.1; Linux)" #10 Browserkennung "-" #11 ???
diese "#8 aufgerufene Domain" bringt webalizer durcheinander. Sie ist nicht Bestandteil des standard-combined-logs. Ob webalizer damit pber einen Parameter umgehen kann, wage ich zu bezweifeln. Hagen -- /HagK/ - hagk@hagk.de Bitte zuerst lesen: http://rfc.net/rfc1855.html (Netiquette) http://www.afaik.de/usenet/faq/zitieren/zitieren-3.php3
Hallo Hagen, hallo Leute, Am Dienstag, 16. April 2002 10:59 schrieb Hagen Kuehnel:
an Christian Boltz 's Tastatur wurde am Montag, 15. April 2002 20:34
200 #6 HTTP-Statuscode 1034 #7 übertragene Bytes (?) www.mydomain.tld #8 aufgerufene Domain [2] "http://www.domain.tld/regionen_de.php?lang=de" #9 Referrer "Mozilla/5.0 (compatible; Konqueror/2.2.1; Linux)" #10 Browserkennung "-" #11 ???
diese "#8 aufgerufene Domain" bringt webalizer durcheinander. Sie ist nicht Bestandteil des standard-combined-logs.
Ob webalizer damit pber einen Parameter umgehen kann, wage ich zu bezweifeln.
Ich fürchte (noch) nicht. In der Doku zu Webalizer (V2.01-06) steht zwar, dass in zukünftigen Versionen geplant ist, beliebige Logformate zu definieren, bisher scheint es aber nur mit einigen wenigen Standardformaten zu gehen. Ich werde wohl mal nach einer neuen Webalizer-Version schauen müssen. Falls das nichts hilft, muss ich wohl endlich perl lernen und Feld #8 aus der Zeile herauslöschen. Gruß Christian Boltz -- Registrierter Linux-Nutzer #239431 Linux - life is too short for reboots.
an Christian Boltz 's Tastatur wurde am Mittwoch, 17. April 2002 00:37 folgendes notiert:
Ich werde wohl mal nach einer neuen Webalizer-Version schauen müssen. Falls das nichts hilft, muss ich wohl endlich perl lernen und Feld #8 aus der Zeile herauslöschen.
ACK damit wäre dann das LOG wieder Standard, einziger Nachteil, Du kannst nicht mehr zwischen den virtuellen Domains unterscheiden, aber auch dies könnte ein Perl-Skript erledigen. split_logfile.pl sollte also das Feld "#8" nehmen, und die Zeile an eine "'8".log anhängen. Dann fütterst Du webalizer mit den jeweligen Log's. Hagen -- /HagK/ - hagk@hagk.de Bitte zuerst lesen: http://rfc.net/rfc1855.html (Netiquette) http://www.afaik.de/usenet/faq/zitieren/zitieren-3.php3
Hallo Hagen, Leute, ich antworte mir mal selbst ;-) Am Mittwoch, 17. April 2002 00:37 schrieb Christian Boltz:
Am Dienstag, 16. April 2002 10:59 schrieb Hagen Kuehnel:
an Christian Boltz 's Tastatur wurde am Montag, 15. April 2002
200 #6 HTTP-Statuscode 1034 #7 übertragene Bytes (?) www.mydomain.tld #8 aufgerufene Domain [2] "http://www.domain.tld/regionen_de.php?lang=de" #9 Referrer "Mozilla/5.0 (compatible; Konqueror/2.2.1; Linux)" #10 Browserkennung "-" #11 ???
diese "#8 aufgerufene Domain" bringt webalizer durcheinander. Sie ist nicht Bestandteil des standard-combined-logs.
Stimmt. Und 1&1 setzt sie auch noch so blöd, dass split_logfile, das bei den Apache-Sourcen dabei ist, nicht passt (das erwartet den VirtualHost am Zeilenanfang)
Ich werde wohl mal nach einer neuen Webalizer-Version schauen müssen.
Webalizer scheint auch in der aktuellen Version noch keine beliebigen Logdateien zu vertragen. (es ist auch nur ein Versionssprung um 0.0.4)
Falls das nichts hilft, muss ich wohl endlich perl lernen und Feld #8 aus der Zeile herauslöschen.
Und wieder eine Kanone, die auf Spatzen schießt ;-) Es geht aber auch einfacher (Perl möchte ich trotzdem lernen). Fürs Archiv: sed "s/\ \(www\.\)\?domain\.net\ / /" access.log > access.log.sed Die Idee habe ich in http://groups.yahoo.com/group/webalizer/message/86 gefunden (hätte ich aber auch selber drauf kommen können ;-) BTW: Warum erhalte ich mit Konquereor (2.2.1) nur eine leere Seite, wenn ich auf die genannte URL zugreifen möchte? Ich habs mir jetzt mit lynx angesehen, da gings ;-) (in beiden Browsern ist wwwoffle als Proxy eingestellt) Gruß Christian Boltz -- Registrierter Linux-Nutzer #239431 Linux - life is too short for reboots.
participants (2)
-
Christian Boltz
-
Hagen Kuehnel