Skip to content

Latest commit

 

History

History
124 lines (70 loc) · 5.66 KB

File metadata and controls

124 lines (70 loc) · 5.66 KB

Sesión 06: Visualización de Datos Avanzada

🎯 Objetivos

  • Aprender a modificar los estilos predeterminados de nuestras gráficas
  • Conocer y aprender a interpretar las siguientes gráficas:
  • Treemaps
  • Scatterplots por categorías
  • Scatterplots con variables condicionantes
  • Binnings Hexagonales
  • Mapas cloropléticos
  • Gráficas de barras apiladas

📂 Contenido

Visualización de Datos Avanzada

En esta sesión vamos a explorar nuevas y poderosas maneras de visualizar datos. Recuerda que una gráfica sirve para hacer más evidente y clara la información que tenemos en nuestro conjunto de datos. Una visualización sólo tiene sentido si es más fácil de interpretar que los datos en crudo o si agrega información que no podemos obtener de otra manera. Visualizar sólo por el hecho de visualizar a veces hace más daño que otra cosa.

Siempre que hagas una visualización pregúntate a ti mismo: ¿Esta visualización facilita la comprensión e interpretación de mis hallazgos? Si la respuesta es sí, entonces sigue adelante.


Estilos

Cuando agregamos estilos a nuestras gráficas, es importante asegurarnos de que no estamos obscureciendo la información. Agregamos estilos por diversas razones:

  1. Para que nuestra gráfica sea más clara
  2. Para que sea agradable a la vista
  3. Para que sea compatible en estilo al resto de nuestra presentación

Dado que muchas veces nuestros Notebooks sirven para presentar nuestros hallazgos a otros, es importante que sean agradables. Nuestras gráficas pueden ser personalizadas a mucho detalle, pero afortunadamente matplotlib y seaborn nos ofrecen algunos estilos prehechos que podemos aprovechar.

Ejemplo 1


Treemaps

Los treemaps son graficas que sirven para visualizar datos jerárquicos usando figuras (normalmente rectángulos) anidadas. Normalmente cada nivel de nuestra jerarquía representa una segmentación utilizando una variable categórica.

Podemos generar treemaps muy fácilmente utilizando la librería plotly.

Ejemplo 2 Reto 1


Variaciones de scatterplots

--

Scatterplots por categorías

Los scatterplots por categorías nos permiten visualizar en una misma gráfica la relación entre dos variables numéricas segmentadas por una variable categórica. La variable categórica se representa de manera visual usando diferentes colores para los puntos de la gráfica. Es muy común realizar scatterplots para visualizar relaciones entre variables y luego colorearlos utilizando una variable dependiente categórica. Así podemos comparar las diferentes categorías de la variable dependiente de manera visual.

Ejemplo 3

--

Scatterplots con variables condicionantes

Hay veces que un scatterplot por categorías no es suficiente para evidenciar las diferencias entre categorías. La razón podría ser que nuestro dataset es demasiado grande o que nuestra variable categórica tiene demasiadas categorías. En estos casos podemos dividir nuestro conjunto de datos utilizando la variable categórica (llamada variable condicionante) y generar un scatterplot independiente para cada una de las categorías. Hay veces que esto resulta más provechoso que graficar todos los datos en la misma gráfica.

Ejemplo 4 Reto 2

--

Binnings Hexagonales

Otra variación de los scatterplots son los binnings hexagonales. Estas gráficas resultan muy útiles cuando tenemos tantos datos que resulta imposible visualizar las densidades de puntos sobre la gráfica.

Un binning hexagonal hace lo siguiente:

  1. Divide el plano cartesiano en un número determinado de hexágonos.
  2. Coloca los puntos del scatterplot sobre el plano.
  3. Cuenta cuántos puntos caen en cada hexágono y le asigna ese conteo a cada hexágono.
  4. Le asigna a cada hexágono un color dentro de un espectro. Entre más obscuro sea el color, más puntos había sobre de ese hexágono. Entre más claro el color, menos puntos había sobre ese hexágono.

De esta manera resulta mucho más fácil visualizar la densidad de los puntos sobre el plano, ya que el espectro se asigna de manera proporcional.

Ejemplo 5

--

Mapas cloropléticos

Cuando estamos trabajando con datos geográficos, muchas veces es necesario agregar mapas que ayuden a visualizar datos estadísticos. Una de las visualizaciones más comunes son los mapas cloropléticos (choropleth maps). Los mapas cloropléticos se parecen de alguna manera a los mapas de calor. Primero dividimos nuestro mapa en regiones (lo más común es dividir por estados o por países ). Luego coloreamos cada región de acuerdo a un espectro de color que representa la segmentación de una variable estadística.

Ejemplo 6 Reto 3

--

Gráficas de barras apiladas

En la misma vena que los scatterplots por categorías tenemos a las gráficas de barras apiladas. Una gráfica de barras apilada se utiliza para graficar un valor numérico segmentado a partir de dos variables categóricas. La primera categoría es la que se utiliza para definir los valores del eje x. La segunda categoría se utiliza para dividir las barras en segmentos.

Ejemplo 7 Reto 4


Postwork

Postwork Sesión 6