23 noviembre 2018

Analizando datos con Python, por Antonio Marín

Dentro de la serie de Meetup que datahack Sur está realizando este curso, el pasado día 22, Antonio Marín hizo una demostración de como se puede analizar una base de datos en bruto y convertirla en información valiosa para una empresa.

Antonio, CEO de DSC Energy nos explicó en una primera parte qué era Python, nos contó que su creador desarrolló este lenguaje con la idea de que fuera fácil de aprender y de usar, y no solo es popular por una gran comunidad de usuarios, sino que además grandes empresas como Facebook o Google participan aportando recursos para que siga evolucionando. Cuenta con más de 140.000 librerías. Es eficiente, fiable y accesible.

Antonio Marín y asistentes a Jueves de Datahack en Sevilla

Nos explicó alguna de sus librerías más usadas, habló de Panda, de Matplotlib, de Seaborn y Anaconda.

Nos quiso dejar claro un par de cosas, la primera es que una exploración de los datos, llamada EDA (Exploratory Data Analytics) es esencial antes de trabajar con los datos y tan siquiera antes de imaginar el modelo, y por otra parte, también es importante antes de ponerse a trabajar es definir bien el problema, lo ideal es que el cliente te lo plantee, hecho esto será más fácil enfocar el objetivo.

¿Qué es big data? - "Es todo aquello que no cabe en una hoja de Excel"

En la segunda parte se planteó el ejercicio de demostración, imaginando por ejemplo que una empresa necesita saber como está el mercado de la clase de productos que vende y la competencia en un país en el que pretende introducirse;, pues bien, gracias a que existen países con transparencia en datos, se pudo acceder a los datos de la aduana de dicho país y extrayendo los códigos del tipo de producto en el que la empresa está especializada, a través de una serie de pasos se llegó a la visualización para el cliente de gráficos temporales de precios de los productos a los cuales se están comercializando y hasta la cantidad vendida por la competencia.

Visualización de datos con Python por Antonio Marín

Para mí, esta demostración fue nada más que suficiente para comprender lo importante que es actualmente tratar la información, y a la vez que esta sea una información abierta y transparente.

Próximamente, Antonio, que él mismo se grabó su exposición, subirá el vídeo completo para que podáis también comprender y entender la extraordinaria herramienta que es Python para estos tipos de trabajo.