fbpx
El lado humano del Análisis de Datos

Introducción

Uno de los grandes desafíos de la tecnología actual es cómo aprovechar el conocimiento adquirido de los datos disponibles. Lamentablemente no se ha prestado suficiente atención al aspecto humano del análisis de datos. Bienvenidos a El lado humano del Análisis de Datos.

Así mismo, otro de los desafíos que enfrenta cualquier marca es cómo aprovechar los conocimientos de las enormes cantidades de datos que normalmente tienen a su disposición. La promesa de big data es, por supuesto, convincente; McKinsey, por ejemplo, ha estimado que un minorista que usa big data potencialmente puede aumentar su margen en más del 60%.

Por lo tanto, se invierte mucho en la capacidad de los científicos de datos para buscar este valor, pero ¿qué tan bien equipados están para entregar esto?

Estudios relativos

La investigación sugiere que el acto de aprovechar el ROI (retorno de la inversión) de big data es más fácil de decir que de hacer.

Una encuesta realizada por Capgemini entre los principales responsables de la toma de decisiones empresariales identificó que solo el 27% consideró que sus iniciativas de datos tuvieron éxito.

En otro estudio, Gartner predijo que el 60% de los proyectos de datos no irán más allá del piloto y la experimentación y serán abandonados.

 Entonces, ¿por qué es esto? Sostengo que no se ha prestado suficiente atención al aspecto humano del análisis de datos. Si bien es tentador suponer que debido a que es una “ciencia numérica” ​​no debemos preocuparnos por la falibilidad humana, la realidad es que tenemos nuestras huellas digitales subjetivas en todo el análisis de datos.

Antes de discutir por qué, vale la pena decir algo sobre por qué no podemos simplemente confiar en las estadísticas para ofrecer la información. Esto es el mayor punto de El lado humano del Análisis de Datos.

Esto se debe a que quienes trabajan con datos reconocen desde hace mucho tiempo que, dado un tamaño de muestra lo suficientemente grande, la mayoría de los puntos de datos tendrán correlaciones estadísticamente significativas. 

Trivialidad

Esto ha sido famoso como el ‘Factor Crud’ – pensando que existen relaciones reales en los datos donde, de hecho, el enlace es trivial.

Nate Silver hizo el mismo punto cuando advirtió que el número de “relaciones significativas” no está aumentando a medida que aumenta el meteórico en la cantidad de datos disponibles. 

¿Qué opina el padre de la meta investigación?

Simplemente generamos un mayor número de falsos positivos, un problema endémico en el análisis de datos, lo que llevó a John Ioannidis a sugerir que dos tercios de los hallazgos en revistas médicas de hecho no eran sólidos. 

Ioannidis ha sugerido recientemente que esto “es más probable que ocurra en campos que persiguen fenómenos sutiles y complejos”, lo que quizás encapsule gran parte de la agenda de marketing moderna.

Entonces, si no podemos confiar necesariamente en técnicas estadísticas para cortar franjas de datos para encontrar patrones significativos, ¿a dónde acudimos? 

Naturalmente, nos miramos a nosotros mismos. Pero tan pronto como reconocemos la participación humana en el análisis de datos (El lado humano del Análisis de Datos) , debemos comenzar a explorar algunas de las fragilidades de nuestro juicio. 

Porque si hay algo que la economía del comportamiento nos ha enseñado, es que ninguno de nosotros es inmune a la mala interpretación de los datos.

Encontrar orden en el caos

Una función cognitiva que seguramente es crítica para cualquier científico de datos es la capacidad de encontrar orden y detectar patrones en los datos. 

Como seres humanos, somos excelentes para hacer esto, por lo que hay buenas razones evolutivas: nuestra capacidad para hacerlo es lo que impulsa los nuevos hallazgos y, por lo tanto, nuestro avance. 

Pero al igual que con todas las funciones cognitivas, nuestra fortaleza también es una debilidad, ya que esta capacidad es tan integral para nosotros mismos que puede volcarse en la detección de patrones cuando en realidad no existe.

Uno de los problemas que encontramos al examinar los datos es que nos resulta muy difícil ver cuándo es aleatorio y cuándo hay patrones de hecho. 

Cuando vemos una secuencia verdaderamente aleatoria, tendemos a pensar que hay patrones en los datos porque de alguna manera parece demasiado ordenado o “abultado”. 

Entonces, por ejemplo, cuando lanzamos una moneda veinte veces, hay un 50% de probabilidades de obtener 4 caras seguidas, un 25% de posibilidades de cinco seguidas y un 10% de probabilidades de una carrera de seis. 

Pero si le da esta secuencia a la mayoría de los individuos, considerarán que estos fueron patrones en los datos y no al azar. 

La falacia de la mano caliente

Esto explica la falacia de la “mano caliente” en la que creemos que estamos en una racha ganadora, en lo que sea, desde las cartas hasta el baloncesto y el fútbol. En cada una de estas áreas los datos son aleatorios,

Este efecto no solo se aplica a los datos numéricos sino también al análisis de imágenes. 

Esto es importante, ya que la visualización se está convirtiendo rápidamente en un elemento clave del análisis de big data, ergo, El lado humano del Análisis de Datos.

Un buen ejemplo de los escollos es la última parte de la Segunda Guerra Mundial, cuando los alemanes tuvieron una campaña de bombardeos particularmente intensa en Londres. 

Era una opinión generalizada en el momento en que las bombas estaban aterrizando en grupos que hacían algunas partes de Londres más peligrosas que otras. 

Sin embargo, después del análisis de la guerra, los datos mostraron que las bombas, de hecho, habían aterrizado en una secuencia aleatoria y que ninguna parte de Londres era más peligrosa que otra.

Es fácil ver por qué los londinenses habían llegado a la conclusión de que había una secuencia en el bombardeo, ya que observar los datos retrospectivamente permite que uno comience a ver patrones. 

Un enfoque más riguroso, por supuesto, nos obliga a generar hipótesis que luego se prueban en otros conjuntos de datos.

Y, por supuesto, una vez que comencemos a ver patrones, rápidamente comenzamos a crear historias que explican los datos. 

Como diría Duncan Watts, todo es obvio cuando sabes por qué. Odiamos la incertidumbre y nos esforzamos por reducir esto adoptando rápidamente explicaciones. 

El desafío que enfrentamos es que tendemos a buscar solo información que sea consistente con la historia que hemos desarrollado. 

Sesgo de confirmación

Este ‘ sesgo de confirmación ‘ se identificó por primera vez en una serie de experimentos en la década de 1960 que mostraron que buscamos datos que confirmen nuestra teoría en lugar de probarla. 

Y cuando obtenemos nueva información, tendemos a interpretarla de una manera que es egoísta. Así que cimentamos nuestra interpretación errónea de datos de manera alarmantemente rápida.

Entonces, ¿dónde deja esto el desafío de encontrar valor a partir de big data? 

¿Es una disciplina?

Primero, debemos superar la idea de que la “ciencia de datos” está libre de subjetividad; francamente no hay disciplina. No es más que una arista de El lado humano del Análisis de Datos.

En segundo lugar, una vez que hayamos reconocido esto, podemos educar a los analistas para que detecten cuándo están formulando juicios subjetivos y brindándoles información sobre cómo mitigar las posibles dificultades.

Tercero, podemos capacitar a los analistas para que examinen el razonamiento detrás de la forma en que ven el mundo, para que puedan tener una mayor conciencia de la forma en que sus mentes configuran la forma en que enfocan su disciplina.

Una vez que somos conscientes de la forma en que vemos el mundo (que no siempre es explícito), podemos elegir si queremos utilizarlo en la forma en que vemos los datos.

Es fácil ignorar estos desafíos, ya que todos queremos asumir que la forma en que abordamos los datos es altamente objetiva. 

Pero a menos que abordemos estos problemas de frente, corremos un riesgo muy real de no poder capitalizar la oportunidad tan prometida que los grandes datos aún deben brindar.

Espero que te haya gustado El lado humano del Análisis de Datos. Te esperamos en el próximo artículo.



Otros enlaces que te puedes ser útiles:

Cómo la nube ha redefinido el mundo del marketing

Contenido en todas partes. Cómo alimentar la voracidad de contenidos.

Algunas ideas cuando tu análisis competitivo resulta nulo

Cómo twittear en el momento adecuado

Sitios Web, ¿cómo hacerlos?

Click para valorarnos!
[Total: 0 Promedio: 0]

Author

Contenidos Soluciones Web Mty

Contenidos de Soluciones Web Mty es nuestro departamento de curación de contenidos. Aquí generamos todos los artículos, infografías, video spots, publicaciones, whitepapers, y todos esos contenidos que tu como usuario y visitante ves en nuestros sitios y redes sociales sobe nuestra Agencia de Diseño, Desarrollo y Estrategias de Marketing y Web.

Comentarios (3)

Deja un comentario