¿Te has encontrado con casos en los que varias personas llegan a conclusiones distintas y/u opuestas utilizando los mismos datos? ¿Cómo hacemos para evitar la desinformación y ser más críticos para aprovecharla correctamente?
¿Te has encontrado con casos en los que varias personas llegan a conclusiones distintas y/u opuestas utilizando los mismos datos? ¿Cómo hacemos para evitar la desinformación y ser más críticos para aprovecharla correctamente?
En ALTO nos preocupamos por mejorar los procesos de toma de decisiones a través del análisis de datos para generar hallazgos y hacer un correcto manejo de la información, manteniendo un análisis crítico que se pueda transformar en acciones para nuestros clientes.
Para lograrlo, utilizamos distintas técnicas estadísticas, empezando por análisis descriptivos, que nos permitan rápidamente tener una idea general de los datos y así pasar a modelos predictivos y/o prescriptivos. Con el fin de evitar errores conceptuales y lógicos que pueden hacer que se lleguen a conclusiones equivocadas, a continuación hacemos algunos consideraciones importantes:
- Evitar asociar causalidad a la relación entre dos variables
Puede ser que encontremos que la venta de helados está correlacionada con la cantidad de robos en una zona de la ciudad, pero ¿esto implica que si prohibimos los helados vamos a reducir los robos?, o ¿podrán estar correlacionadas las dos variables por un factor condicionante como el clima?
Realizar análisis sin sobre agrupar los cálculos, para evitar obtener conclusiones opuestas (Paradoja de Simpson)
Por ejemplo, puede suceder que en un estudio sobre el riesgo de muerte por enfermedades cardiovasculares en fumadores y no fumadores, se concluya con los datos aglomerados que hay una menor tasa de muertes en los fumadores.
Antes de publicar esta cifra, podríamos darnos cuenta que esto sucedió porque en el estudio la mayoría de los fumadores eran jóvenes, mientras que los no fumadores eran personas de edad. Al analizar cada grupo aparte probablemente encontremos que los fumadores tienen una mayor tasa de muerte por enfermedades cardiovasculares en ambos casos.
- Considerar las variables relevantes, y la incidencia de los factores externos
Al analizar la efectividad de una campaña de marketing, probablemente se deberá analizar la conversión, el monto de la compra, la frecuencia y hasta la satisfacción del cliente de forma simultánea. Adicionalmente se deberá considerar cómo la economía en el país, la competencia en el sector, el clima, etc. afectan cada una de las mediciones.
- Considerar el sesgo, el tamaño y el azar de los datos
Al analizar el servicio al cliente de nuestra empresa, cada uno de éstos puede interpretar de diferente manera una calificación alta, siendo algunos más exigentes que otros a pesar de sentirse igualmente satisfechos. Adicionalmente, al ser opcional la calificación por parte de los clientes, puede suceder que la mayoría de clientes insatisfechos participen, mientras que muy pocos satisfechos lo hagan, lo que haría que la calificación promedio no represente la opinión general.
Finalmente, en caso de hacer encuestas aleatoriamente, los resultados podrán variar dependiendo de los clientes escogidos, siendo muy importante considerar la cantidad de calificaciones recolectadas. Por ejemplo, de asumir que en realidad el 90% de los clientes quedan satisfechos, al utilizar pocos datos tendremos un riesgo mayor de tener cifras alejadas del valor real.
- Evaluar la dependencia de los datos y la influencia de datos atípicos en el análisis
De igual manera, así como sabemos que con variables continuas tiene sentido calcular la media, y con variables categóricas la moda, es importante diferenciar la manera de analizar eventos correlacionados de aquellos independientes.
Finalmente, recuerda siempre tener claro los objetivos de tus análisis, ser muy crítico en la validez e interpretación de los mismos, evita forzar los datos a los resultados esperados y en lo posible recuerda mencionar los supuestos y consideraciones hechas.