Statistiche web con WebAlizer

WebAlizer è un software molto usato per il monitoraggio dei visitatori di un sito web. Completamente gratuito e open source è facilmente installabile su ogni server o vps dove risiede una distribuzione Linux.
Vediamo come installare Webalizer su Debian 6 (Lenny).
La prima cosa da fare è aggiornare il sistema operativo mediante i soliti comandi:
apt-get update && apt-get upgrade

A questo punto si può installare anche webalizer.
apt-get install webalizer
Installiamo pure un editor di testo come nano, se non fosse disponibile.
apt-get install nano

Ora creiamo un file virtual hosting per Apache così da poter accedere alle statistiche web usando il browser.
cd /etc/apache2/site-available
nano aaawebalizer

Ora poniamo nel file che si sarà aperto queste righe

<VirtualHost *:80>
ServerAdmin webmaster@localhost
ServerName miosito.it
DocumentRoot /var/www/webalizer
<Directory /var/www/webalizer>
Options FollowSymLinks -Indexes
AllowOverride All
order deny,allow
deny from all
allow from 127.0.0.1 XXX.XXX.XXX.XXX
</Directory>

ErrorLog /var/log/apache2/webalizer.log
LogLevel warn
CustomLog /var/log/apache2/webalizer-access.log combined

</VirtualHost>

Avendo cura di sostituire XXX.XXX.XXX.XXX con il proprio indirizzo IP pubblico fisso (quello della connessione Internet non del web server), così soltanto chi possiedo l’indirizzo IP stabilito potrà visionare le statistiche web.
Ovviamente anche statistiche.miosito.it va sostituito con il nome di dominio del vostro sito, facendo attenzione al fatto che statistiche.miosito.it è un dominio di terzo livello quindi dovete avere la possibilità di crearne uno e associarlo all’IP address del vostro vps o server.

Si deve eseguire regolamente l’aggiornamento delle statistiche. Lo si può fare in diversi modi e anche i dati tenuti in considerazione possono essere quelli dei mesi passati oppure solo quelli relativi all’ultima settimana.
Per fare ciò è possibile impostare un cronjob.
crontab -e

Ora si aprirà una schermata nella quale inseriremo questa riga:
4 * * * * webalizer -o /var/www/webalizer /var/log/apache2/sito-da-monitorare-access.log

Ogni 4 ore tutti i giorni della settimana verranno aggiornate le statistiche. Ricordatevi di sostituire sito-da-monitorare-access.log con il nome del file di log degli accessi del sito web che volete monitorare.

Per migliorare la localizzazione degli IP address, ossia poter correlare un indirizzo IP con il relativo paese di locazione, è possibile utilizzare la versione gratuita di GeoIP. GeoIP è un database che contiene le associazioni fra IP e stati il quale viene aggiornato una volta al mese.
Per scaricare GeoIP lite basta posizionarsi nella cartella /etc/webalizer
cd /etc/webalizer
Scaricare il file
wget http://geolite.maxmind.com/download/geoip/database/GeoLiteCountry/GeoIP.dat.gz
Scompattare l’archivio
gunzip GeoIP.dat.gz
Aprire il file di configurazione di webalizer e abilitare il database alternativo.
Per fare ciò, è necessario aggiungere in fondo al file:

GeoIP           yes
GeoIPDatabase   /etc/webalizer/GeoIP.dat

Allo stesso modo è possibile migliorare il riconoscimento dei referer escludendo il proprio sito web dalle statistiche ponendo alla fine del file:

HideSite        localhost
HideSite        *miosito.it
HideReferrer    miosito.it/

dove miosito.it va sostituito col domain name del proprio sito web.
Inoltre c’è la possibilità di aggiungere anche il motore di ricerca Bing che non è presente nella lista dei search engine di webalizer. Si metta quest’ulteriore riga alla fine del file di configurazione di webalizer:
SearchEngine    bing.com        q=

Ricordatevi di ricaricare Apache prima di usare le statistiche web offerte da Webalizer:
/etc/init.d/apache2 reload

virtualbox

Articolo precedente

MAC OS X in VirtualBox
javaee

Articolo successivo

Prima applicazione su JBoss con NetBeans