JPO : Webinar d'information sur nos formations → RDV mardi à 17h30.

DataViz : Definición, objetivos y usos

DataViz

La visualización de datos, a menudo llamada "Dataviz", es el conjunto de técnicas que permiten transformar y sintetizar visualmente los datos brutos para hacerlos hablar.

¿Lo sabías?

El Dataviz es un proceso de transmisión de información que se remonta a varios siglos atrás. 

En el siglo XVIII, el ingeniero y economista William Playfair inventó el histograma, el gráfico circular y las series temporales, 3 tipos sencillos de gráficos que siguen siendo muy utilizados en la actualidad.

Dataviz
1 - William Playfair (1759 - 1823), pionero en dataviz

Hoy en día, el Dataviz está en todas partes, desde su último informe de análisis del sitio web hasta los medios de comunicación más importantes. También es una poderosa herramienta de comunicación a la que se le puede dar un buen uso en la Ciencia de los Datos.

Imaginemos que acaba de realizar un análisis exhaustivo de una base de datos que contiene las compras y las características de muchos consumidores. En el transcurso de su análisis debe haber observado mucha información muy útil, por ejemplo, el impacto de la estrategia de promoción decidida por su empresa. Debe tener indicadores de rendimiento definidos para dar credibilidad a su análisis. Así que acabas con un montón de cifras que son difíciles de entender para todo el mundo. 

¿Cómo puede resumir su análisis de forma inteligible y clara sin utilizar tablas de cifras indigestas?

Aquí es donde entra Dataviz.  La visualización de datos le ofrece un conjunto de técnicas para transformar datos brutos y a menudo complejos en representaciones visuales accesibles para que puedan ser comprendidos rápidamente por el mayor número de personas posible.

Mediante el uso de gráficos, como los diagramas circulares o los histogramas, podrás sintetizar y organizar tu análisis. Además, el acceso a los datos se hace más rápido, más relevante y más fácil de compartir y utilizar por las diferentes ramas.

Podrá contar la historia de su análisis, utilizando lo que se conoce como storytelling. Mejor que ilustrar, hay que desplegar, utilizando las herramientas que ofrece dataviz, los pasos de tu razonamiento hasta la conclusión.

¿Cómo hacer Dataviz con Python?

En los últimos años, Python se ha convertido en el lenguaje de referencia para explorar y analizar conjuntos de datos.

Una de las ventajas de Python es que se puede utilizar el mismo lenguaje gratuito y de código abierto para muchas tareas de ciencia de datos, como la minería de datos, el análisis estadístico, el aprendizaje automático y la visualización de datos.

Matplotlib es la primera biblioteca de Python que genera y gestiona varios tipos de gráficos, de forma bastante sencilla y ordenada.

También es el más utilizado en la Ciencia de Datos con Python, y el más común en la formación de Vizualización de Datos.

matplotlib
2- Gráficos realizados con Matplotlib

Se han creado muchas otras bibliotecas, basadas en Matplotlib, para modernizar los gráficos y hacer su creación aún más sencilla.

Esto es particularmente cierto en el caso de Seaborn, que es muy popular por sus gráficos estadísticos y su desconcertante simplicidad.

Esta biblioteca se utiliza además de Matplotlib. Para la gestión avanzada del diseño de su gráfico; títulos, marco, ejes; Matplotlib resultará indispensable mientras que Seaborn será más apreciado por su estética.

3- Graphique Seaborn
3- Gráficos de Seaborn

Más recientemente, la aparición de bibliotecas como Plotly o Bokeh, permiten crear gráficos interactivos de alto nivel, que pueden integrarse fácilmente en una página web, sin necesidad de dominar JavaScript.

4- Graphique Plotly
4- Gráficos de Plotly
5 - Graphique Bokeh
5- Gráficos de Bokeh

Con bibliotecas especializadas, como Holoviz o Geoviews, también se pueden crear rápidamente dataviz cartografiados, muy populares entre los medios de comunicación.

Holoviz
6- Gráficos de Holoviz

Hay muchas otras herramientas, como Dash, que permite crear cuadros de mando y aplicaciones web con sus gráficos.

Todos estos paquetes tienen la ventaja de estar muy bien documentados y ser fáciles de usar (siempre que hayas trabajado previamente con tus datos), y te permitirán mostrar y guardar gráficos de buena calidad que resuman eficazmente la información de tu conjunto de datos según el mensaje que quieras transmitir.

Podrás mostrar hasta 4-5 informaciones fácilmente en un mismo gráfico, y con 2 líneas de código, con algunas de las funciones de Seaborn. 

Para una aplicación web que contenga varios gráficos interactivos, necesitará un código más largo, así que es usted quien debe decidir cuánto quiere invertir en función del resultado esperado.

¿Quiere saber más sobre DataViz? ¡Descubre nuestra formación especializada!

Facebook
Twitter
LinkedIn

Tag de l'article :

Vous souhaitez être alerté des nouveaux contenus en data science et intelligence artificielle ?

Laissez-nous votre e-mail, pour que nous puissions vous envoyer vos nouveaux articles au moment de leur publication !

Newsletter icone

S'inscrire à la JPO :

Vous souhaitez recevoir notre newsletter data 💌 hebdomadaire ?