|
Caso de estudio
Comparación de tecnologías de medición
Tracking ASP Metric vs. Análisis
de Log-files
La tecnología de Tracking
ASP de análisis de audiencia y el tradicional análisis
de log, pueden producir grandes diferencias estadísticas
en el mismo sitio.
Para examinar la diferencia, nosotros comparamos los page-views
analizados por Tracking ASP Metric y el popular análisis
de log en un actual web site comercial.
Esta comparación demuestra que la diferencia en estadísticas
de tráfico se debe a la diferencia en el método de
colección de datos, y que el log file produce errores aun
en sitios típicos.
Introducción
La tecnología de
Tracking ASP de análisis de audiencia y el tradicional análisis
de log, puede producir grandes diferencias estadísticas en
el mismo sitio. Esto no es sorprendente - tomar los datos del trafico
directamente del browser del usuario en lugar de tomarlo del log
file que genera el servidor, Tracking ASP es generalmente mas acertado
que el análisis de log y esta diferencia puede resultar significante.
Para examinar las diferencias entre
las 2 tecnologías, nosotros hemos hecho un estudio de los
page views contados en un simple DIA de un sitio comercial, comparando
Tracking ASP Metric con el popular log-file.
La diferencia en page-views fue
considerable: el log file reporto 19,360 page views, mientras que
Tracking ASP Metric reporto solo 4,739.
El estudio de este caso, examina
las causas de las potenciales diferencias en page views:
1. Código Tracking ASP
2. Html Frames
3. Tráfico Artificial
4. Muestra de dispositivos limitados
5. Otros Factores
Como está explicado más
abajo, esta prueba demuestra que la medición de Tracking
ASP fue acertada, y muestra como el análisis de log file
resultó tener un largo sobreconteo.
1. Código de Tracking
ASP
Para implementar el código
de Tracking ASP en un sitio, el dueño del sitio debe insertar
una sección del código de Tracking ASP en el código
HTML para cada página que se desea monitorear. Cuando una
página es cargada en el browser del usuario, el código
toma el page view y otros datos adicionales.
Dos temas son relevantes para el
estudio del código de Tracking ASP: Las páginas que
no contienen el código de Tracking ASP, y el lugar donde
es insertado el código en cada página.
Páginas sin el código
de Tracking ASP:
Cuando se implementa Tracking ASP en un sitio, el dueño
del sitio debe elegir incluir el código de Tracking ASP en
algunas páginas, y omitirlos en otras. Tracking ASP solo
colecta los datos de las páginas en la que fue puesto el
código. En cambio, el análisis de log provee las estadísticas
de todas las páginas, lo cual puede ser una causa significante
cuando se compara el reporte deTracking ASP con el Análisis
de Log.
En nuestro estudio, algunas de las páginas del sitio no esta
puesto el código de Tracking ASP. El análisis de log
reporto 3,153 page views para ese sitio. Para restringir nuestra
comparación a estas páginas monitoreadas por Tracking
ASP y el Log File nosotros hemos sustraído 3,153 page views
del log file total de 19,360 obteniendo un total de 16,207 reduciendo
asi la diferencia entre ambas tecnologías.
Ubicación del código
de Tracking ASP
En general, en deseable poner el código de Tracking
ASP cerca del comienzo del código Html. Esto asegura que
el código sea ejecutado cuando la página se ejecuta.
Si el código de Tracking ASP es puesto al final del código
Html, si el usuario cancela la carga de la página antes de
que el código se ejecute, provocaría que ese page
view no se contabilice.
Para el estudio, nosotros verificamos que el código de Tracking
ASP este cerca del comienzo del código Html, ya que haciendo
esto nos aseguramos que los códigos que no llegan a ejecutarse
no sea la causa por la cual Tracking ASP cuente pocos page views
comparados con el análisis de Log.
2. HTML Frames
Los frames, son independientes
de las áreas de un sitio. Por otra parte, va a haber un archivo
html por cuantos frames hayan.
Los Frames pueden ser un problema para el log file. Por ejemplo:
si tengo un sitio con 4 frames, el log file va a contar 1 page view
por cada frame, más un page view generado por el frame set.
El frame set, es por ejemplo el index.html, que es el archivo que
llama a los demás frames. Por lo tanto, tenemos un total
de 5 page views contabilizados por el log, cuando en realidad, se
desplegó una sola página, lo cual genera en líneas
generales, una diferencia de 5 a 1.
Tracking ASP, no tiene este problema. Cuando el código es
utilizado correctamente, el código de Tracking ASP aparece
solo una vez, por cada página desplegada, evitando asi que
cuente de mas por la presencia de frames.
Muchas de las páginas vistas en nuestro estudio hemos observado
presencia de frames, el cual produjo un sobreconteo en el reporte
del log, con un total de 9,579 page views extras. Quitando de la
cuenta esos 9,579 page views, el reporte del log se reduciría
a unos 6,628 page views ya mas cerca del recuento de Tracking ASP,
en 4,739 page views.
3. Tráfico Artificial
Otra causa del exceso
del recuento de page views contabilizados por el log file, es el
trafico artificial, generado por programas que generan peticiones
al sitio, pero que cuyas páginas no son vistas por usuarios,
lo cual genera un sobre cuento. Nosotros examinamos los efectos
de los 2 tipos de trafico artificial: las herramientas de monitoreo
y los robots.
Herramientas de Monitoreo:
Las herramientas de monitoreo, como SiteScope o Webtrends,
generan requests a los sitios, los cuales son contabilizados por
el log, como page views.
Tracking ASP no cuenta los page requests como page views. Esto es
así porque el código de Tracking ASP es técnicamente
una imagen. Dado que las herramientas de monitoreo no ejecutan un
código de imagen, Tracking ASP, correctamente, no cuenta
los page views como page requests.
En nuestro estudio la herramienta de monitoreo fue configurada para
monitorear solo una de las páginas en estudio. Cuando nosotros
quitamos del conteo los page views extras para eliminar los efectos
que pueda ocasionar los frames sobre el conteo final, hemos eliminado
los page requests causados por las herramientas de monitoreo. Sin
embargo, el análisis de log contabilizo cientos de page views
extras causadas por la herramienta de monitoreo.
Robots:
Los robots, (también llamados "spiders" o
"crawlers"), son programas que navegan por el sitio automáticamente.
Dado que los robots no son usuarios, los page views que estos generan,
deben ser excluidos del reporte.
El log file debe saber de la actividad de un robot en el sitio que
se esta analizando. Dado que hay millones de robots, el análisis
de log no puede identificar a los mismos.
Tracking ASP no tiene este problema. Los robots, no ejecutan el
código de Tracking ASP, dado que Tracking ASP excluye la
actividad de los robots de los reportes de trafico.
Identificar los page views causados por los robots en el análisis
de log, es todo un desafío. Para terminar con esto, nosotros
hemos creado un software que identifica la potencial actividad de
los robots en cada entrada del log file, el cual describe el agente
haciendo el request. Analizando el numero único de redes
de clase C, y dominios asociados con cada agente, pudo detectar
los robots.
Usando esta herramienta, nosotros identificamos 1,500 page views
causados por robots - cerca de 3 veces el numero que el log file
detecto usando estas listas de robots -, Tracking ASP contabilizó
4,739.
Esto da cuenta de que el análisis del log file sigue contabilizando
page views adicionales causados por no detectar la totalidad de
los robots.
4. Electrónicos con pantalla
limitada
Las PDA´s y otros
dispositivos que tienen el display limitado, a menudo son configurados
para no cargar las imágenes. Esto no afecta al conteo de
page views del log file -el log file graba cada page request proveniente
de esos dispositivos como si fuera de cualquier otro, y la herramienta
de análisis de log file cuenta cada page request, como un
page view. Por el contrario, dado que el código de Tracking
ASP es técnicamente una imagen (one pixel gif), este no es
ejecutado cuando la página es desplegada sin imágenes.
Como resultado, Tracking ASP no cuenta page views provenientes de
esos dispositivos.
En nuestra prueba de page views
causados por los robots, nosotros identificamos muchos page views
provenientes de los servicios de downloads para los dispositivos
de display limitado.
La diferencia no puede ser identificada
como un sobreconteo por el análisis de log, o una falta de
conteo por Tracking ASP; esto depende de los requerimientos del
dueño del sitio. Si el dueño del sitio intenta mostrar
una advertencia a los usuarios, lo cual es típico en sitios
comerciales.
5. Otros Factores
Auque varios usuarios
se disfrutan con conexiones rápidas a Internet, otros cuentan
con conexiones lentas, redes congestionadas, y otros impedimentos.
En casos extremos, estas condiciones pueden evitar que Tracking
ASP contabilice a estos usuarios. Aunque nosotros no observamos
claras evidencias de este efecto en estudio, lo cual puede contribuir
a las diferencias entre las dos tecnologías.
Conclusión
En nuestra comparación
de Tracking ASP Metric y el popular software de análisis
de log, sacamos 2 puntos importantes:
Las diferencias en las estadísticas
entre los dos sistemas son el resultado de las diferencias en el
método de colección de datos.
Fallas inherentes en el log file pueden producir errores
significantes en sitios comunes.
Este estudio es una comparación
exhaustiva de las dos tecnologías. Hay otras diferencias,
incluyendo la certeza de otras estadísticas, el nivel de
detalle, la velocidad, la accesibilidad, la confiabilidad, la facilidad
de operación.
|