10:00
R
CONAHCYT-Universidad de Guadalajara
9 de enero de 2025
dplyr
ggplot()
Sintáxis básica de uso.
Personalización de gráficas.
Integridad y excelencia en el uso de gráficas.
10:00
Importa el archivo 02_taylor-swift-spotify.csv
(lo puedes obtener de este Enlace. Usa la función View()
para visualizar la base de datos.
Usa la función summarise()
para calcular el promedio de la variable danceability
y el número de canciones incluidas en cada albúm.
Crea un subconjunto de los datos denominado maxpop
(máxima popularidad) que contenga las variables: name
, album
, relase_date
, danceability
y popularity
para las 10 canciones más populares. Usa las funciones arrange()
y row_number()
. Muestra el valor de la variable popularidad en orden descendente.
Los primeros gráficos conocidos aplicados a datos económicos fueron elaborados por William Playfair (1759-1823), un ingenierio mecánico y economista político escocés, en su libro The Commercial and Political Atlas y The Statistical Breviary.
Se le considera el pionero en el uso del gráfico de líneas para representar series de tiempo, y fue el creador del gráfico circular, de sectores y de barras.
“La información que se adquiere de forma imperfecta generalmente se retiene de forma imperfecta; una persona que ha investigado detenidamente una tabla impresa descubre, al finalizar, que solo tiene una idea muy vaga y parcial de lo que ha leido, y que, al igual que una figura impresa en la arena, pronto queda totalmente borrada y desfigurada […].
Al observar atentamente cualquiera de estos gráficos, se logrará una impresión suficientemente clara que permanecerá intacta durante un tiempo considerable y, la idea que perdure, será sencilla y completa […]”
— William Playfair en The Commercial and Political Atlas
E.J. Marey, La méthode graphique
Ilustración por Alisson Horst
ggplot2
ggplot2
es una reimplemantación de los principios propuestos por Hadley Wickham en el libro The Grammar of Graphics.En esta sesión vamos a usar datos de The World Inequality Database Descarga aquí. (La base está disponible en la página del curso)
Rows: 1,610
Columns: 6
$ country <chr> "Algeria", "Algeria", "Algeria", "Algeria", "Algeria", "Alge…
$ continent <chr> "Africa", "Africa", "Africa", "Africa", "Africa", "Africa", …
$ year <int> 2010, 2011, 2012, 2013, 2014, 2015, 2016, 2017, 2018, 2019, …
$ fshare <dbl> 0.0992, 0.1120, 0.1201, 0.1206, 0.1160, 0.1221, 0.1232, 0.12…
$ top1 <dbl> 0.1003, 0.0991, 0.0991, 0.0991, 0.0991, 0.0991, 0.0991, 0.09…
$ inc_head <dbl> 12610.627, 12619.984, 12634.026, 12531.988, 12546.430, 12533…
Variables:
fshare
: Proporción de ingresos generados por mujeres.top1
: Proporción de personas en percentil 1 de ingresos.inc_head
: Ingreso per cápita (adultos)ggplot()
ggplot()
sin ningún argmuento nos genera un lienzo (canvas) en blanco. Sobre este lienzo podemos agregar:
dataframe
con las variables y valores a graficar.ggplot2
para conocer más sobre su implementación.World Inequality Database
%>%
Podemos usar el operador pipe (%>%
o |>
) en combinación con ggplot()
:
dplyr
y ggplot
`stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
Ejes: Las funciones más rápidas para las modificaciones más comunes.
ggplot
Podemos personalizar la apariencia de nuestras observaciones especificando su forma, color, tamaño/ancho y la transparencia ( alpha ).
Podemos añadir más variables usando el componente estético para representar nuestros datos con diferentes colores, formas y tamaños.
ggplot2
convierte automáticamente el nombre de los continentes a variables categóricas y asigna un color.ggplot2
para más detallesggplot2
Podemos utilizar facetas (gráficos de paneles) para visualizar variables categóricas:
La función facet_wrap()
crea subconjuntos de los datos y muestra una gráfica para cada subconjunto.
Podemos personalizar el arreglo de las facetas usando las opciones nrow
y ncol
.
ggsave()
es útil para guardar las gráficas que tenemos activas en el panel plot
.::::::