Cómo hicimos nuestra investigación con los datos de AppSumo

Este artículo es el segundo de una serie de posts escritos por Sonia García, que ha estado realizando sus prácticas con nosotros durante el verano. Este post explica el trabajo realizado y es una memoria pública del mismo. Te recomendamos leer el primer artículo.

Una de las tareas que he desarrollado durante las prácticas en Quoters fue el análisis de los datos de los usuarios, pero no de todos los usuarios de la aplicación sino de un conjunto de ellos, los que habían adquirido el servicio a través de la oferta de AppSumo.

Se me plantearon una serie de objetivos que debía conseguir observando y analizando los datos disponibles. Había varias variables de las que se deseaba conocer ciertas cosas que podrían ser útiles a la hora de tomar decisiones sobre la herramienta y sus usuarios, por ejemplo, los continentes en los que se ubicaban los consumidores principales, el % de suscripciones a descuentos y newsletters o el volumen medio de propuestas activas de cada usuario.

La base de datos con la que he trabajado tenía más de 7000 registros, con más de 100 variables que filtrar, es decir, había que indagar muy bien en los datos, buscar las variables que ofrecerían datos de interés para el negocio y procesar todo ese conjunto.

Para trabajar de una forma más clara, creé una nuevo conjunto de datos resumido con aquellas variables que eran necesarias para mi investigación, tomando únicamente aquéllas que correspondían a usuarios de AppSumo. Una vez listos todos los materiales necesarios para comenzar el trabajo, procedí a la observación de las variables, ordenándolas, observando su comportamiento y codificándolas.

Trabajar bien las variables de base de datos de manera previa nos ahorrará mucho tiempo posteriormente

Para poder trabajar con SPSS es importante tener una base de datos codificada, es decir, haber transformado ciertas variables a número. Esto permite que la herramienta procese toda información de forma más clara, pues con los números los errores tipográficos quedan descartados. No obstante, sí es importante que algunas variables se mantengan cómo variables de escala (letras), pues solo tienen sentido de esta manera.

SPSS por sí mismo suele identificar el tipo de variable de tu base de datos (escala, numérica, ordinal…), pero conviene realizar un proceso previo para introducir los valores y las etiquetas correspondientes, evitando así problemas posteriores de comprensión.

Probablemente la preparación y la codificación de los datos fuese el trabajo más costoso de los desarrollados, pues hay que tener claros los objetivos buscados, conocer de manera exacta el significado de las variables y observarlas previamente para poder codificarlas de una manera correcta que permita el posterior trabajo de revisión y toma de decisiones..

La codificación si no hay errores tipográficos suele ser bastante simple en Excel, pues únicamente requiere reemplazar palabras por números, más allá de las diferentes maneras de presentarse la misma información. En lo que se refiere al procesamiento de los datos en SPSS, es conveniente conocer previamente el funcionamiento de la aplicación y los análisis multivariantes, pues no todas las variables son validas en los análisis.

Antes de presentar toda la información al equipo de Quoters, realicé una observación de los resultados obtenidos, interpretándolos para obtener unas conclusiones que ayudaran a la toma de decisiones posterior. De hecho, y procedí a interpretarlos y sacar pequeñas conclusiones que pudiesen ayudar a tomar decisiones.

Hacer un análisis de los datos resultó ser importante para conocer el comportamiento de los usuarios y obtener cierta información sobre el producto.