Accès Client


Tag-based versus log-based… Pardon?

5 mars 2008

Depuis que nous sommes Google Analytics Authorized Consultants, une question nous est souvent posée. Il s’agit d’un constat de la part de clients, qui se demandent pourquoi des différences notables peuvent exister entre les statistiques de visites de leur site internet collectées par Google Analytics et celles collectées par leur outil d’analyse de fichiers journaux (logs) tel que Webtrends ou encore Urchin.

Essayons donc d’y voir plus clair dans tout ça.

Les outils “log-based”, plus précis

Tout d’abord, il faut savoir que les fichiers journaux ont existé au moment même o le premier serveur web a vu le jour: ils sont en quelque sorte les ancêtres encore bien vivants de l’analyse web. Chaque visite, que dis-je, chaque “hit” est alors automatiquement ajouté dans le fichier, qu’il s’agisse de l’affichage d’une image, du chargement d’un fichier javascript ou du passage d’un robot d’un moteur de recherche sur le site. Rien ne leur échappe puisque c’est sur le serveur que ce processus ce déroule.

Néanmoins, ouvrir un fichier log et essayer d’y comprendre quelque chose n’est permis qu’aux utilisateurs chevronnés, et encore là , il leur sera bien difficile d’obtenir une vue d’ensemble du trafic de leur site sur une période donnée. C’est là qu’interviennent les outils d’analyse de fichiers log tels que Webtrends ou Urchin: leur rôle est de compiler les logs et de les afficher ensuite de manière structurée afin qu’ils deviennent simplement compréhensibles, le tout dans une interface claire et structurée, elle aussi. Puisque rien n’est sensé leur échapper, les outils d’analyse web “log-based” sont dits plus précis que leurs concurrents “tag-based”.

Les outils “tag-based”, plus flexibles

Les outils d’analyse web dits (en bon français) “tag-based” fonctionnent bien différemment des outils reposant sur l’analyse des fichiers journaux. Google Analytics, XITI ou encore IndexTools fonctionnent de cette façon. Dans leur cas, le “tag” de tag-based signifie qu’un code supplémentaire doit être ajouté à toutes les pages du site afin d’assurer une vision d’ensemble du trafic la plus proche possible de la réalité. Le code en question peut être du Javascript, un fichier témoin (cookie) ou encore une image à charger sur un site externe. Une fois que les pages sont correctement taguées, les données commencent à arriver dans l’interface de l’outil.

Puisqu’ils reposent sur du code Javascript, des cookies ou des images externes, un certain pourcentage de visites peut alors échapper à leur contrôle. En effet, il est possible pour un utilisateur d’empêcher l’affichage d’images en provenance d’un domaine autre que le site qu’il visite, ou encore d’empêcher son navigateur de générer des cookies ou d’exécuter du code Javascript. Il reste difficile de mesurer avec précision le nombre d’utilisateurs qui ont mis en pratique ces restrictions, mais il demeure faible (de l’ordre de 5 à 10%).

Les outils tels que Google Analytics, que nous connaissons très bien, sont cependant beaucoup plus flexibles, notamment dans la manipulation des données, la configuration de l’interface ou la création de rapports spécifiques. Grâce à de nombreux profils segmentés intelligemment, ou par l’intermédiaire des filtres, dont la création ne trouve ses limites que dans l’imagination et les compétences en expressions régulières de son auteur, il est toujours possible d’obtenir les données clés qui feront la différence auprès du client.

Les pour, les contre

Chacun des outils a ses propres avantages et ses propres inconvénients, que je pourrais lister dans un éventuel prochain billet si je trouve le temps nécessaire. Chez Ressac Media en tous cas, nous nous sommes tournés vers Google Analytics dont l’approche marketing plus poussée que ses concurrents “log-based” nous a convaincu, sans compter la possibilité de lier les comptes Analytics et AdWords d’un même client afin de recueillir les données financières de sa campagne SEM.

Nous trouvons les outils “log-based” plus souvent orientés vers les données “brutes” et les chiffres, même s’il est vrai que les données qu’ils collectent sont généralement plus proches de la réalité. C’est bien sûr sans parler des coûts parfois exorbitants en hardware et en licences que certains outils d’analyse de fichiers log requièrent, alors que Google Analytics est complètement gratuit.

Pour conclure, si vous disposez des ressources tant humaines que financières, optez pour les deux systèmes. Dans le cas contraire, considérez plutôt l’approche favorisée par Google Analytics, nous sommes persuadés qu’elle rendra votre vie plus simple!

Christophe Camart

Faites passer le mot! (Qu’est-ce que c’est?) Ces icônes sont des liens vers des sites de partage de signet sociaux où les lecteurs peuvent partager et découvrir de nouveaux liens.
  • Facebook
  • Google
  • Nuouz
  • Technorati
  • Scoopeo
  • Digg
  • del.icio.us
  • Furl
  • StumbleUpon
  • Wikio FR
Étiquettes :,
» Publiez un commentaire maintenant

Pas encore de commentaire.

» Flux RSS des commentaires de cet article.
» TrackBack URI


Publiez un commentaire

*
To prove you're a person (not a spam script), type the security word shown in the picture. Click on the picture to hear an audio file of the word.
Click to hear an audio file of the anti-spam word