Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/cienciadedatos/datos

Traducción al español de los datasets utilizados en el libro "R para Ciencia de Datos"
https://github.com/cienciadedatos/datos

Last synced: 3 months ago
JSON representation

Traducción al español de los datasets utilizados en el libro "R para Ciencia de Datos"

Host: GitHub
URL: https://github.com/cienciadedatos/datos
Owner: cienciadedatos
License: cc0-1.0
Created: 2018-07-14T17:07:44.000Z (over 6 years ago)
Default Branch: main
Last Pushed: 2023-11-14T23:44:39.000Z (over 1 year ago)
Last Synced: 2024-10-28T17:32:17.368Z (4 months ago)
Language: R
Homepage: https://cienciadedatos.github.io/datos/
Size: 42.8 MB
Stars: 45
Watchers: 6
Forks: 26
Open Issues: 3
Metadata Files:
- Readme: README.Rmd
- License: LICENSE.md

Awesome Lists containing this project

README

        ---

output: 

  github_document

---

```{r setup, include=FALSE}

library(datos)

library(ggplot2)

library(dplyr)

library(purrr)

library(stringr)

knitr::opts_chunk$set(echo = TRUE)

```

# datos 

[![CRAN status](https://www.r-pkg.org/badges/version/datos)](https://cran.r-project.org/package=datos)

[![R-CMD-check](https://github.com/cienciadedatos/datos/workflows/R-CMD-check/badge.svg)](https://github.com/cienciadedatos/datos/actions)

Este paquete provee la traducción al español de conjuntos de datos en inglés originalmente disponibles en otros paquetes de R. Los datos traducidos son los que se utilizan en los ejemplos del libro [R para Ciencia de Datos](https://cienciadedatos.github.io/r4ds/), la versión en español de [R for Data Science](https://r4ds.had.co.nz/) de Hadley Wickham & Garrett Grolemund. El paquete `datos` puede utilizarse junto con el libro o de manera independiente como fuente de datos de práctica en español. 

## Instalación

El paquete `datos` puede instalarse directamente desde CRAN:

```{r, eval = FALSE}

install.packages("datos")

```

La versión en desarrollo está disponible en GitHub y puede instalarse utilizando `remotes`:

```{r, eval = FALSE}

# install.packages("remotes")

remotes::install_github("cienciadedatos/datos")

```

## Traducciones

Las traducciones disponibles dentro de `datos` son las siguientes:

```{r, echo = FALSE}

specs <- list.files("inst/specs")

all <- map(file.path("inst", "specs", specs), yaml::read_yaml)

sources <- map_chr(all, ~.x$df$source)

pkgs <- tibble(

  Nombre = map_chr(all, ~.x$df$name),

  Titulo = map_chr(all, ~.x$help$title),

  Paquete = map_chr(strsplit(sources, "::"), ~.x[[1]]),

  Dataset = map_chr(strsplit(sources, "::"), ~.x[[2]])

)

pkgs <- tibble(

  Nombre = map_chr(all, ~.x$df$name),

  Titulo = map_chr(all, ~.x$help$title),

  Paquete = map_chr(strsplit(sources, "::"), ~.x[[1]]),

  Dataset = map_chr(strsplit(sources, "::"), ~.x[[2]])

)

pkgs %>%

  arrange(Paquete, Dataset) %>%

  knitr::kable()

```

Los datos para practicar la manipulación de cadenas (_strings_) son `oraciones`, `palabras` y `frutas`. 

## Uso

El paquete `datos` se carga igual que todos los paquetes de R: 

```{r}

library(datos)

library(ggplot2)

library(dplyr)

```

Las variables que contienen los datos van a estar disponibles inmediatamente para su uso, pero los datos no se traducirán hasta que la variable sea "llamada" explícitamente en el código que se escriba. En este ejemplo, el _dataset_ `diamantes`, que proviene de `ggplot2::diamonds`, se carga en la memoria de R en el momento en que lo llamamos por primera vez en español:

```{r}

glimpse(diamantes)

```

Los datos traducidos quedarán cargados durante toda la sesión de R:

```{r, eval = FALSE}

diamantes %>%

  filter(corte == "Bueno") %>%

  ggplot() +

  geom_boxplot(aes(claridad, precio, fill = claridad)) +

  theme(legend.position = "none") +

  labs(title = "Diamantes", subtitle = "Precio y claridad")

```