Comprendre l’échantillonnage de données en Analytics

Qu’est-ce que le «Data Sampling» ou échantillonnage de données en analytics ?

Pour traiter un volume important de données et assurer un traitement rapide de cette masse de données, la technique du data sampling est encore très largement utilisée au moment même où l’on ne parle que de « Big Data ». En analytics, cette technique présente l’avantage de pouvoir restituer de manière instantanée les données (sans consommer trop de ressources de traitement du côté de l’éditeur, donc minimiser le cout de traitement, et oui le big data gratuit cela n’existe pas encore!). En revanche, la fiabilité et l’intégrité des données peuvent être remise en question.
Au final, on constate que des intervalles de données hétérogènes peuvent donner des résultats assez éloignés de la réalité, conclusions :
– Plus la taille de l’échantillon est grande, plus le résultat sera proche de la réalité.
– Les échantillons doivent être statistiquement représentatifs.
– La répartition des données a un impact important sur le résultat quand les sets de données ne sont pas distribués de manière homogène.

Le double tracking des sites eCommerce… fanatisme analytique!

Pourquoi les sites eCommerce utilisent plusieurs solutions de tracking en parallèle ? Il n’est pas rare de constater que de nombreux sites eCommerce exploitent plusieurs solutions analytiques en parallèle : Comscore + Google analytics, Webtrends + Google Analytics ou encore Coremetrics + Google Analytics… En résumé, les ecommerçants payent des sommes conséquentes pour installer et exploiter un outil web analytique et, installent en complément Google Analytics.
Certains utilisent 2 GPS dans leur voiture et d’autres portent une montre sur chaque poignet, alors pourquoi pas mais gardons en tête notre objectif. La raison invoquée réside souvent dans la possibilité de pouvoir comparer les données de 2 outils et de déterminer la fiabilité de celles-ci. Or, il est impossible de remonter des données identiques dans 2 outils distincts pour plusieurs raisons :

Google réinvente l’analytics avec Universal Analytics

Google n’en finit plus de réinventer l’analytics, après le lancement il y a quelques semaines seulement de son Tag management system : ‘ « Google Tag Manager » . Lors de sa conférence annuelle, Google Analytics Partner Summit 2012, la firme de Mountain View, annonce un nouveau produit pour pallier aux problématiques analytiques du moment à savoir :

L’impossibilité de tracker un visiteur unique sur des terminaux multiples
La complexité du parcours multicanal de l’utilisateur

Les technologies actuelles ne semblent pas répondre correctement à ces problématiques avec une grande fiabilité, même avec l’émergence des outils d’analyses multicanal et de la mesure hybride (combinaison des données issues de panel et web analytique). Alors comment Google compte s’y prendre ?