Analisis de desviación de los datos de sesión ¿Necesito analizar a nivel de usuario?

Empezamos con el primer post de la serie dedicada a metodologías de análisis del usuario. Empezamos por el principio y en este caso nuestro objetivo será el de responder a un pregunta simple: ¿Merece la pena que realice en mis negocios este tipo de análisis? ¿realmente no me basta con los informes que ya tengo? La respuesta a esta pregunta como siempre es: «Depende», hay muchos negocios y generalizar en analítica es pecado, tabú, estúpido y además está mal.

Lo que vamos a hacer es decribir una metodología sencilla con la que realizar un primer acercamiento a los datos de una web para decidir si tiene sentido o no sentido que nos preocupemos de la parte de los datos que perdemos por analizar a la vieja usanza (a nivel de sesiones). Para ello miraremos varios detalles sobre nuestros datos y conversiones y estimaremos una desviación de la credibildiad de los datos de sesión. Con ella será con la que decidamos que hacer.

En el complejo mundo del usuario solos los frikis quieren meterse

Partamos de una realidad: a nadie le gusta trabajar por que si. Te sientes muy tonto cuando terminas un análisis al detalle cuyas conclusiones no te aportan absolutamente nada que no supieses. Por ese motivo conviene perder un poco de tiempo garantizando que no vamos a perder muchísimo más. Al final probar cosas nuevas mola -al menos a los analistas nos suele molar- y es altamente recomendable hacer un ejercicio de análisis de este tipo solo para interiorizar y saber lo que te puede ofrecer, pero lo dicho, cuando no va a aportarnos nada debemos saberlo de antemano.

Así que vamos a ver una serie de indicadores que nos hablarán de la necesidad real que tiene nuestro negocio de trabajar en este mundo de usuarios. Si vemos que estos indicadores no son favorables tenemos que asumirlo y olvidarnos del análisis de usuarios en nuestro negocio.

Entendiendo la métrica de usuario en Google Analytics

Un detalle que tenemos que entender es cómo se hace el calculo de la métrica de usarios en GA (y en muchos otros sistemas). Estamos acostumbrados a que todas nuestras métricas y mediciones sean absolutas y por lo tanto nos sorprendemos cuando nos encontramos una métrica que dependiendo de cómo la consultemos pueda tener un valor u otro… y este es justo el caso de los usuarios.

¿Por qué pueden variar su valor?

Básicamente porque es una métrica que se calcula en función del periodo de tiempo que seleccionemos. Imaginemos el siguiente caso:

  • Un usuario realiza una sesión el día 1 del mes.
  • Realiza una segunda sesión el día 3.
  • Y una tercera sesión el día 6 en la cual compra.

Tenemos muy claro que se trata de 3 sesiones y una conversión. Pero, ¿cuantos usuarios son? La lógica nos dice que se trata de un solo usuario pero como os decía analítics nos lo presentará según las fechas que le consultemos. ALgunos ejemplos:

  • Si le pido a GA, cuantos usuarios hay desde el día 1 hasta el 6 del mes me dirá que solo hay 1. Genial.
  • Si le pido cuantos había del 1 al 3. Me dirá que también hay solo 1, lo cual tambiés es cierto, pero se trata ahora de un usuario con solo 2 sesiones en vez de tres.
  • Ahora si le pido cuantos usuarios hubo del dia 1 al 5 y cuantos del 6 al 10 para sumarlos, me dirá que hay 1 con 2 sesiones del 1 al 5. Y 1 con 1 sesión del 6 al 10. Cuando yo lo sume veré que son 2 usuarios lo cual no es cierto… Aqui mucha gente comete errores al sacar datos parciales y sumarlos.
  • También si le pido los datos por una dimensión basada en fechas me devolverá por ese criterio cada. Dato. Es decir, si le pido a analytics que me diga los usuarios por día. Me dirá:
    >> Día 1: 1
    >> Día 2: 0
    >> Día 3: 1
    >> Día 4: 0
    >> Día 5: 0
    >> Día 6: 1
    >> Día 7: 0
    >> Total usuarios: 1

Es raro, ¿verdad? Pero es que es cierto, tenemos 1 usuario para esos días pero el total de usuarios suma 1 :)

En consecuencia cuando yo veo gráficas de evolución por días o por semanas en Analytics los datos no coincidirán con los totales que veo al unificar usuarios que aparecen en varios días por separado. y a mayor diferencia entre el tamaño de los grupos de fechas mayor será esta diferencia.

Aqui os dejo una captura donde vemos que el total de usuarios en una consulta de 5 días no coincide con la suma de los usuarios por día:
diferencias-usuarios-por-dia

Por este tipo de pecularidades es preferible trabajar con fechas amplias cuando hablemos de usuarios, pues cuanto menor sea el rango de fechas seleccionados más usuarios parciales estaremos cogiendo.

Primer indicador: Sesiones por usuario

El es el indicador más fácil al que podemos acceder y surge de la simple división entre sesiones y usuarios. Una métrica que nos dirá cuantas sesiones provocan de media los usuarios en nuestro site.

Para muchos la forma más sencilla de acceder a este indicador será ir Google Analytics a sus informes de Público >> Visión general y realizar la división a mano.

Es un cálculo bastante directo y sencillo al alcance de todo el mundo.

Sin embargo hay que saber que en realidad esta es una métrica nativa de Google Analytics llamada «Sesiones por usuario» y por lo tanto podemos usarla en nuestros informes personalizados:

metrica-sesiones-por-usaurio

Esto tiene varias ventajas, a parte de evitarnos hacer una división a mano, claro. Principalmente disponer esta métrica nos aporta dos ventajas:

    1. Nos permite ver cómodamente la evolución de la misma en el tiempo con las típicas gráficas de evolución de GA.
    1. Permite poder cruzarla con distintas dimensiones de analítytics para empezar a intuir como es la revisita según distintos criterios: Países, dispositivos, Canales de captación, etc.

informe-metricas-por-usuario
(nótese que el problema que decíamos que existía con los usuarios al separar por días sigue aquí vigente y por ejemplo en esta captura si miramos la gráfica por días vemos que el valor e sesiones/usurio/dia se mantiene de forma estable en unas 1,3 sesiones)

¿Y para que quiero yo saber este dato?

Las sesiones por usuario nos indican cuantas sesiones hacen los usuarios pero también que ratio de información incompleta tengo en un análisis por sesiones. Por lo general sabemos que el análisis a nivel de usuario en métricas globales de sesiones/usuario que queden por debajo del 1,2 es probable que no mezcan la pena. Estamos hablando de negocios en los que la reincidencia de un usuario es muy baja y casi todas las métricas se conforman a nivel de sesión.

Por encima de estos valores ya entramos en la zona interpretable, valores más altos suponen una desviación mayor en el análisis de sesiones y los más bajos una desviación menor. Así un ratio de de 2,00 sesiones/usuario nos indicaría que la mitad de los datos de conversión y funnels no son del todo correctos, pues esos usuarios que nos aparecen en cierto paso del embudo de conversión en realidad tuvieron otra visita en la que siguieron evolucionando. Nos queda claro, pero es quizas un poco abstracto. Asi que esto nos lleva a nuestro segundo indicador.

Segundo indicador: Desviación directa de los informes de sesión

En base al anterior indicador vamos a crear otro un poco más descriptivo. Decíamos que a mayor número de sesiones por usuario más «incorrectos» son nuestros datos a nivel de sesión. Vamos por lo tanto a calcular el ratio de desviación de la realidad que sufren nuestros informes generales, al menos para conocerlo.

Este ratio tiene que decirnos en que porcentaje la información que vemos puede no ser del todo correcta. Sería algo parecido al muestreo, estadisticamente podemos trabajar sabiendo que esta desviación existe y sacar conclusiones pero no podemos obviar que esta desviación existe y que a niveles muy altos puede hacernos tomar conclusiones erróneas.

Este cálculo es tan simple como

  • ( (sesiones – usuarios) / sesiones ) x 100

Y no, no es una métrica que nos ofrezca analytics de forma nativa. pero si que podríamso si quisiésemos crearla con las métricas calculadas.

Por ejemplo. Tenemos 200 sesiones y 100 usuarios. Esto nos da 2,00 sesiones por usuario y una desviación de los informes de sesión de un 50%…

( (sesiones - usuarios) / sesiones ) x 100
= ( ( 200 - 100 ) / 200 ) x 100
= ( 100 / 200 ) x 100
= 0,5 x 100
= 50 %

Así que en este caso podemos decir que la desviación de nuestros informes es del 50%, es un caso exagerado que permite trabajar a nivel de sesión pero solo si nuestro volumen de visitas es grande y no vamos a sacar informes muy granulares.

¿Existe una desviación de los datos de sesión normal?

Realmente no existe, depende de demasiados factores como el tipo de producto, el precio y los métodos de pago, el tipo de campañas que hagamos, la notoriedad y reputación de la marca, etc. Como extremos puedo hablaros de que las webs de captación de registros (leads) en base a landings suelen estar por de un 20% o incluso 5% de desviación, mientras que webs de productos caros y complejos como pueden ser paquetes vacacionales o excursiones pueden incluso pasar ese 50% del que hablábamos antes prácticamente obligádnote a trabajar a nivel de usuario.

Tercer indicador: tamaño del proceso de decisión del usuario

Y cambiamos de tercio totalmetne de tercio para irnos a los informes de embudos multicanal y centrarnos ahora un poco en nuestras conversiones. Estos informes son de los pocos informes de Google Analytics que se orientan totalmetne al usuario. En ellos podemos ver como los datos de procedencia de las visitas (normalemnte canales de captación) se van sucediendo para terminar consiguiendo las conversiones.

No vamos a abordar aqui todos los informes de este tipo, para eso tenemos otro post dedicado al análisis de conversiones multicanal. Recordemos que solo estamos intentando evaluar la necesidad real que tenemos de hacer análisis a nivel de usuario.

Lo primero al usar estos informes es seleccionar las conversiones que queremos observar. Por defecto (y por desgracia) en estos informes se autoseleccionan todos los objetivos de GA + conversiones de ecommerce + objetivos de dobleclick (si los tenemos integrados con GAP). Esto no nos conviene porque mezclamos churras con merinas y terminamos no viendo nada. Lo suyo es empezar seleccionado el macroobjetivo principal de nuestro negocio para más adelante, si queremos, analizar la conversión de otros objetivos.

MCF-seleccionar-conversion

Una vez tenemos seleccionada la conversión a seguir, es el momento de evaluar la longitud del proceso de decisión del usuario, es decir, cuan largo es este proceso.

Para ello tenemos dos posibles visiones:

1) Medirla en días desde la primera visita.
2) O en Sesiones totales necesarias para convertir.

tamaño-proceso-decisión

Medir en días es quizás más cercano a nuestra realidad. Nos va a ser más facil comunicar que el usuario se toma de media 2 semanas para decidir reservar un apartamento que hablar a alguien no muy metido en el online de sesiones.

Por otro lado, para mi al menos, tiene más sentido hablar de sesiones si las entendemos como distintas aproximaciones que hace el usuario a la web antes de decidirse. Y es que podemos encontrarnos con procesos rapidos pero complejos en los que un usuario visita una oferta 4 veces en solo 2 días y por el contrario procesos de maduración muy lenta pero con poca consulta en los que un usuario necesite varias semanas para decidirse pero apenas acceda 2 o 3 veces a la web en ese tiempo. Son circunstancias distintas asi que en realidad no podemos obviar ninguno de los dos valores (al menos en una primera aproximación).

Aqui nos contraremos con el problema de que los datos vienen muy desglosados, por numero de días o de sesiones (según el informe que miremos) y eso lo dispersa mucho. Así que tenemos que saber que queremos mirar:

Lo primero: porcentaje de conversiones directas.

Es decir, en el día 0 o la sesión 1. este el mejor indicador que tendremos de que porcentaje de nuestros ratios de conversión y funnels a nivel de sesión son exactos. Si tenemos por ejemplo solo un 20% de conversiones en primera sesión, significa que en nuestros funnels solo el 20% de los datos son lo que creemos, el resto de ratios estan llenos de visitas previas que hacen bajar los porcentajes de conversión.

Aquí consideraremos los datos por encima del 50% como entornos donde el análisis de conversión a nivel de sesión sigue teniendo sentido y por debajo del 20% como conversiones con un mix de sesiones demasiado arriesgado como para creernos nuestros funnels.

Una vez hemos hecho este ejercicio con nuestra conversión principal podemos cambiando la selección de conversión analizada ocuparnos de ver cada uno de los objetivos que tenemos configurados. Si hemos sido listos y hemos dado de alta cada uno de los pasos de nuestro embudo como objetivos podremos ver para cada paso en que porcentaje se alcanza este en primera visita.

Otro dato interesante: la mediana del tamaño del proceso de decisión

Es decir, del total de conversiones ordenadas por su distancia cual es la distancia de la conversión que se encuentra en el punto medio.

Esto podemos hacerlo llevando estos datos a excel, o calculandolo a mano, que no es tan dificil. Para hacerlo a mano necesitamos encontrar el punto medio, que será el total de conversiones/2.

En el gráfico que indicabamos antes:
tamaño-proceso-decisión

Tenemos un total de 643 conversiones, asi que la mediana se encuentra en la conversión 322.

Recorremos los datos de menor a mayor hasta encontrarla.

643 conversiones / 2 = 332 conversiones
332 - 235 en primera sesión = 97
97 - 145 en segunda sesión = -48

Asi que la mediana está en 2 sesiones para convertir

Esta mediana es otra referencia que nos dice por lo general cuantas conversiones suelen hacer falta para convertir.

Una vez tenemos esta mediana para nuestro macroobjetivo tambien podemos sacarla para otros objeitvos que tengamos viendo para cada paso del embudo de conversión cuanto hace falta para alcanzarlo.

Y por ultimo, agrupaciones por distancias

Por ultimo si queremos dar una visión más completa podemos dividir porcentajes de conversión por distancias de conversion (en tiempo o sesiones) pero en ese caso es preferible que hagamos nuestros propias agrupaciones.

A mi personalmente me funciona bastante bien crear grupos que con un tamaño que crece exponencialmetne, entendiendo que a mayor distancia de conversión en realidad también las diferencias están mas dialtadas. Asi por lo tanto los grupos de conversiones según sesiones con un sistema así serían:

  • Conversión en 1 visita
  • En 2-3 visitas
  • En 4-7 visitas
  • En 8-15 visitas
    etc…

Con este tipo de datos podemos segmentar un poco mejor los distintos tipos de procesos decisión a sabiendas de que no hay solo un patrón para tomar decisiones.

Conclusiones

Con estos 3 tipos de indicadores la decisión de si lanzarnos a realizar análisis a nivel de usuario o no se vuelve mucho más sencilla.

Las sesiones por usuario son un primer y rapidísimo indicador sobre la necesidad que tenemos de cambiar nuestra perspectiva. El porcentaje de desviación de los informes de sesión terminarán de hacernos comprender la gravedad del problema que tenemos con los informes que estamos consumiendo al tiempo que nos permitirá explicar de forma comprensible que tenemos controlado hasta que punto podemos fiarnos de nuestros datos. Por ultimo un análisis del tamaño del proceso de decisión nos permitirá llevar esta problemática al terreno que más nos interesa: cómo afectan estas desviaciones a mi conversión y por qué. Este último punto será el que nos permita terminar de dibujar nuestro escenario.

¿qué decisión debo tomar? Ahí está nuestro trabajo, saber transmitir si tenemos o no un problema por realizar análisis orientados a sesión. A partir de aquí lo que hay que sopesar es: «cuanto me cuesta resolver la situación» vs «cuanto me afecta no hacerlo» y tomar una decisión.

En el caso de que los datos te lleven a meterte en el mundo del usuario, bienvenido seas. Esta serie de posts es para ti, te invito a seguir leyendo estos distintos capítulos para ir viendo como resolver cada problema:




Source: http://feeds.feedburner.com/ikhuerta

Analisis de desviación de los datos de sesión ¿Necesito analizar a nivel de usuario?

Metodologías de Análisis del usuario

Llega el verano y a la gente le aumentan las ganas de leer… O eso se dice, quizás se refiera a novelas y demás literatura para evadirse, pero por si acaso he pensado en prepara una serie post de los chulos para explicaros algunas cosas en las que estamos trabajando actualmente.

En esta serie de posts hablaremos del análisis a nivel de usuario. Es decir, acercándonos lo máximo posible a las personas reales y no quedándonos solo en páginas o sesiones sueltas. Un paso difícil de dar, no vamos a negarlo, pero que hace más reales todas las conclusiones que obtenemos de la analítica.

Todo lo que ya se ha hablado y de lo que se está hablando

Sobre esto y sobre el famoso customer journey veréis mucha información por la red, la mayoría en inglés aunque con grandes artículos también en castellano. El análisis del usuario esta de moda lo que provoca que haya mucha gente hablando de este tipo de enfoque últimamente. Pero creo que tenemos un problema, y según voy viendo es que todo el mundo habla de lo mismo:

  • Por un lado se nos presenta el concepto de customer journey, que es genial y difícil de rebatir, pero la mayoría simplemente lo describe conceptualmente lo cual sirve en la práctica para poco. Al fin y al cabo no nos dedicamos a realizar mapas mentales de los usuarios para poder dar charlas de psicología sino que lo que buscamos es que los negocios mejoren sus resultados.
  • Por otro lado tenemos el tan de moda análisis multicanal: Modelos de atribución, secuencias de campañas, etc. Aquí hay mucha chicha pero que solo podemos aprovechar en entornos de marketing pues no se nos habla de la web en si, sino de que tan solo tocamos la adquisición del tráfico cruzada con las conversiones; a nivel de usuario, eso sí. Es una información genial, pero solo con eso no podemos decir que conozcamos a nuestros usuarios

Siempre parece que nos falten piezas para resolver este puzle. Por un lado sabemos que nuestros análisis a nivel de sesión (visitas, rebotes, funnels, etc.) no son todo lo realistas que cabria esperar, por otro tampoco sabemos como llevar esta riqueza de datos al mundo de los usuarios; al menos con Google Analytics.

Este es el motivo de esta serie de post que vais a ir viendo publicados: Vamos a ver que posibilidades tenemos para hacer este tipo de análisis. Para ello usaremos mucha información y conceptos propios. Es decir, lo que os voy a contar es cosecha propia y difícilmente podréis verlo en algún libro, es el resultado de buscar como resolver distintos problemas que nos hemos ido encontrando en entornos donde sabemos que la orientación a usuario es vital para entender los datos.

El Customer Journey y los problemas del análisis cuantitativo del usuario

Partamos de la base. Sabemos que los usuarios son en realdiad personas y que la mayoría de nosotros necesitamos varios inputs para tomar una sola decisión. En definitiva, no llego a una web por una publicidad, veo un producto y lo compro siguiendo un estricto funnel de compra. Antes de la compra viene la decisión de compra y antes de esta viene una evaluación mental que todos hacemos de los productos y servicios que se nos ofrecen. De esta indiscutible verdad nace el concepto del «customer journey» que nos explica con distintas teorías cómo el usuario va avanzando en su proceso de decisión por distintos estados mentales hasta la compra. Es decir, nos explica el «viaje del cliente».

Entre las distintas formulaciones que nos han hecho los grandes gurús del marketing en la práctica cada uno hace su mix. Hay muchas perspectivas y no te puedes casar con todas. Nosotros trabajamos con un esquema como el que sigue, donde intentamos mezclar las partes de funnel de decisión de compra, con el concepto de lealtad del usuario y con los estadios del usuario heredados del inbound marketing.

Es un esquema. Pero hay otros. De cara a lo que vamos a hablar en este post no tiene mucha importancia, solo lo incluyo para ilustrar que podéis encontrar muchas metodologías para abordar el customer journey.

El problema de este esquema que os planteo (y de tantos otros) es que es que es imposible de medir completamente pues tenemos una gran cantidad de áreas desinformadas (en la fase de conciencia ni siquiera conocemos al usuario y en la de evaluación los inputs externos se escapan de nuestro control). Además aunque consiguiésemos estimar todos los valores posibles nos encontraríamos con tal cantidad de datos cruzados que sería imposible ver nada en ellos. A fin de cuentas estos esquemas son modelos conceptuales que no necesariamente van destinados a poder realizar analítica cuantitativa sobre ellos sino a sentar las bases de lo que estamos estudiando.

La solución

Al final lo que necesitamos es una metodología (o varias) que nos arrojen datos cuantitativos y sencillos de entender a la vez. Y es que los seres humanos, las personas, somos limitados. Muy limitados. No podemos intentar mirar a Matrix y entender lo que sucede, necesitamos que la información se transforme en algo comprensible para nosotros. Esto no es cierto siempre, todos conocemos a maquinas mentales que se se miran una cuadricula de 60×60 filas y son capaces de darte conclusiones al instante. Pero lo común es que esto no sea así y lo cierto es que tan importante es disponer de los datos como que cualquier persona involucrada en un proceso de decisión los entienda. Ahi, en la búsqueda de este modelo, es donde todos llevamos años dándole vueltas a «cómo representar los datos que tenemos sobre el customer journey para poder entenderlos y sacar conclusiones de ellos». Y esto no es fácil… parece casi imposible… siempre falla algo…

Tras darme contra un muro varias veces, el camino que por mi parte he tomado es el de desistir en este intento. Ya esta bien. Es el momento de aceptar nuestras limitaciones y abordar estos problemas de otra forma más sencilla, más plausible. Buscamos sencillez, encontrémosla simplificando el problema: trabajemos por focos.

¿qué es esto de los focos? pues no es otra cosa que NO intentar crear un modelo que lo contenga todo, sino distintos modelos parciales en los que cada uno resuelva una parte vital de la información (un foco) que nos interesa. Así pues nos podemos permitir simplificar la información y obviar agujeros en la misma y sacar los insights que nos interesan uno a uno. El truco está por lo tanto en describir y desarrollar los focos que realmente nos importan del usuario, sabiendo que controlándolos todos el mundo del usuario pasará a estar un poco más a nuestros alcance.

Así que el trabajo que hemos realizado a sido el de detectar y proponer soluciones para esos focos, siempre con la visión puesta en el usuario. Y así, poco a poco hemos resuelto distintos de ellos que os vamos a ir presentando. Los focos que de momento tenemos identificados son los siguientes:

  • La desviación sesión/usuario:
    Que nos tiene que indicar lo importante que es para nuestro negocio hacer análisis a nivel de usuario. Vital sobretodo para no perder el tiempo con estas historias si no va a aportarnos nada que no sepamos ya.
  • Análisis del funnel de touchpoints:
    Análisis de Funnels pero llevados al mundo de los usuarios y por lo tanto con implicaciones distintas en la definición de pasos y en las métricas a observar de estos
  • Evolución de las preferencias de uso de los usuarios:
    Inputs sobre cómo afecta lo que aprende el usuario de nuestra web al uso que hace de la misma
  • Objetivos de avance en el customer journey:
    Que nos tienen que permitir cuantificar el éxito en las primeras visitas del usuario al site, para saber si estas van iniciar un proceso de decisión o un descarte directo
  • Análisis de la fidelización:
    Cómo son las revisitas y las recompras al site. Cómo obtener KPIs de fidelización
  • y por supuesto, el análisis de conversiones multicanal:
    Que nos tiene que ayudar a gestionar desde marketing el customer journey hacia la compra

Como véis es muchisima información la que queremos identificar, por ese motivo este es solo un post de presentación. A lo que haremos en los siguientes posts es tratar cada uno de estos focos con Google analytics y dar ejemplos de uso comunes.

Seguidamente añado la lista con sus respectivos links que iremos completando en las siguientes semanas, espero que el tema os parezca interesante.



Nos vemos las próximas semanas aquí mismo.

Source: http://feeds.feedburner.com/ikhuerta

Metodologías de Análisis del usuario