Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/rivaquiroga/guaguas

Un paquete de R con datos sobre nombres de bebés registrados en Chile entre 1920 y 2021
https://github.com/rivaquiroga/guaguas

Last synced: 3 months ago
JSON representation

Un paquete de R con datos sobre nombres de bebés registrados en Chile entre 1920 y 2021

Awesome Lists containing this project

README

        

---
output: github_document
---

```{r, include = FALSE}
knitr::opts_chunk$set(
collapse = TRUE,
comment = "#>"
)
library(guaguas)
```

# guaguas

[![CRAN status](https://www.r-pkg.org/badges/version/guaguas)](https://CRAN.R-project.org/package=guaguas)
[![R-CMD-check](https://github.com/rivaquiroga/guaguas/workflows/R-CMD-check/badge.svg)](https://github.com/rivaquiroga/guaguas/actions)

Datos sobre nombres de guaguas (bebés) registrados en Chile entre 1920 y 2021, según el Servicio de Registro Civil e Identificación. Incluye solo los que fueron inscritos como primer nombre.
Este _dataset_ permite explorar tendencias en los nombres registrados durante el último siglo y puede utilizarse como fuente de ejemplos para aprender/enseñar a trabajar con datos.

## Instalación

El paquete `guaguas` puede instalarse directamente desde CRAN:

``` r
install.packages("guaguas")
```
La versión en desarrollo puede instalarse desde GitHub:

``` r
# install.packages("devtools")
devtools::install_github("rivaquiroga/guaguas")
```

## Datos

El dataframe `guaguas` contiene `r nrow(guaguas)` observaciones para cinco variables:

| variable | descripción
|---|---|
| `anio` | año de inscripción |
| `nombre` | el nombre inscrito |
| `sexo` | sexo registral (F, M, I) |
| `n`| número de ocurrencias del nombre |
| `proporcion` | proporción del nombre respecto del total de inscripciones del año |

El dataframe `guaguas_frecuentes` contiene una muestra de `r nrow(guaguas_frecuentes)` observaciones, que corresponde a los nombres con al menos 15 ocurrencias por año.

## Ejemplos
A continuación se muestran algunos ejemplos de exploración de estos datos.

```{r echo=FALSE, message=FALSE}
library(guaguas)
library(dplyr)
library(ggplot2)
library(stringr)
library(hrbrthemes)
library(forcats)
```

#### El contexto político en los años sesenta y setenta

Los dos momentos en que aumentan las inscripciones con el nombre _Salvador_ en los años sesenta y setenta coinciden con elecciones presidenciales en las que se presentó Salvador Allende como candidato (1964, 1970). El año siguiente de su elección como presidente (1971) es el año con mayor cantidad de inscripciones en esas décadas. Luego del Golpe Militar los registros comienzan a bajar y encuentran su punto más bajo en 1978.
El nombre _Augusto_, por su parte, sube en los registros en 1973 y 1974, pero luego su popularidad baja.

```{r eval = FALSE}
library(guaguas)
library(dplyr)
library(stringr)
library(ggplot2)
library(forcats)
library(hrbrthemes)
library(ggthemes)

guaguas %>%
filter(nombre %in% c("Salvador", "Augusto"), anio >= 1960 & anio <= 1979) %>%
ggplot(aes(anio, n, color = fct_reorder2(nombre, n, anio))) +
geom_line() +
scale_color_colorblind() +
labs(x = "año", y = "total inscripciones", color = "nombre",
title = "Inscripciones de 'Salvador' y 'Augusto' entre 1960 - 1979") +
theme_ipsum()

```

#### El efecto "Romané" en el año 2000
Según [IMDB](https://www.imdb.com/list/ls006742360/), [Romané](https://es.wikipedia.org/wiki/Roman%C3%A9) ha sido una de las teleseries más vistas en Chile. Emitida el año 2000, el nombre de su protagonista tiene un incremento en las inscripciones de ese año.

```{r message = FALSE}
guaguas %>%
filter(str_detect(nombre, "(Y|J)ovanka"), n >= 10)
```

También aumentaron las inscripciones de nombres de otros personajes de la teleserie:

```{r eval = FALSE}
guaguas %>%
filter(nombre %in% c("Milenka", "Branco", "Salomé"), anio > 1980) %>%
ggplot(aes(anio, n, color = nombre)) +
geom_line() +
scale_color_colorblind() +
labs(x = "año", y = "total inscripciones",
title = "Inscripciones de nombres de personajes de 'Romané'") +
theme_ipsum()

```

#### El efecto Backstreet Boys

Alguno de los nombres de integrantes de los [Backstreet Boys](https://es.wikipedia.org/wiki/Backstreet_Boys) aumentaron hacia fines de la década de los noventa. Como suele ocurrir con nombres en inglés, es posible encontrar variaciones en la forma de escribirlos: _Brian_, _Bryan_, _Brayan_.

```{r eval = FALSE}
guaguas %>%
filter(nombre %in% c("Brian", "Kevin", "Bryan", "Brayan"), sexo == "M") %>%
ggplot(aes(anio, n, color = fct_reorder2(nombre, anio, n))) +
geom_line() +
scale_color_colorblind() +
labs(x = "año", y = "total inscripciones", color = "nombre",
title = "El efecto 'Backstreet Boys'") +
theme_ipsum()

```

Un cartel visto durante la presentación de los Backstreet Boys en el Festival de Viña del Mar 2019. Fuente: FMTiempo

## Fuente de los datos

Los datos fueron obtenidos a través del Portal de Transparencia del Sistema de Registro Civil e Identificación de Chile.

## Etimología

La palabra _guagua_ viene del quechua _wawa_ y es la forma que en Chile y algunos países de Sudamérica se utiliza para referirse a un/a bebé.

## Paquetes similares

* [`babynames`](https://github.com/hadley/babynames): nombres registrados en EE. UU.
* [`prenoms`](https://github.com/ThinkR-open/prenoms): nombres registrados en Francia.
* [`ukbabynames`](https://github.com/mine-cetinkaya-rundel/ukbabynames): nombres registrados en el Reino Unido.