Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/cienciadedatos/datos
Traducción al español de los datasets utilizados en el libro "R para Ciencia de Datos"
https://github.com/cienciadedatos/datos
Last synced: 3 months ago
JSON representation
Traducción al español de los datasets utilizados en el libro "R para Ciencia de Datos"
- Host: GitHub
- URL: https://github.com/cienciadedatos/datos
- Owner: cienciadedatos
- License: cc0-1.0
- Created: 2018-07-14T17:07:44.000Z (over 6 years ago)
- Default Branch: main
- Last Pushed: 2023-11-14T23:44:39.000Z (12 months ago)
- Last Synced: 2024-07-23T06:09:23.617Z (4 months ago)
- Language: R
- Homepage: https://cienciadedatos.github.io/datos/
- Size: 42.8 MB
- Stars: 44
- Watchers: 6
- Forks: 26
- Open Issues: 3
-
Metadata Files:
- Readme: README.Rmd
- License: LICENSE.md
Awesome Lists containing this project
README
---
output:
github_document
---
```{r setup, include=FALSE}
library(datos)
library(ggplot2)
library(dplyr)
library(purrr)
library(stringr)
knitr::opts_chunk$set(echo = TRUE)
```# datos
[![CRAN status](https://www.r-pkg.org/badges/version/datos)](https://cran.r-project.org/package=datos)
[![R-CMD-check](https://github.com/cienciadedatos/datos/workflows/R-CMD-check/badge.svg)](https://github.com/cienciadedatos/datos/actions)Este paquete provee la traducción al español de conjuntos de datos en inglés originalmente disponibles en otros paquetes de R. Los datos traducidos son los que se utilizan en los ejemplos del libro [R para Ciencia de Datos](https://cienciadedatos.github.io/r4ds/), la versión en español de [R for Data Science](https://r4ds.had.co.nz/) de Hadley Wickham & Garrett Grolemund. El paquete `datos` puede utilizarse junto con el libro o de manera independiente como fuente de datos de práctica en español.
## Instalación
El paquete `datos` puede instalarse directamente desde CRAN:
```{r, eval = FALSE}
install.packages("datos")
```La versión en desarrollo está disponible en GitHub y puede instalarse utilizando `remotes`:
```{r, eval = FALSE}
# install.packages("remotes")
remotes::install_github("cienciadedatos/datos")
```## Traducciones
Las traducciones disponibles dentro de `datos` son las siguientes:
```{r, echo = FALSE}
specs <- list.files("inst/specs")
all <- map(file.path("inst", "specs", specs), yaml::read_yaml)
sources <- map_chr(all, ~.x$df$source)
pkgs <- tibble(
Nombre = map_chr(all, ~.x$df$name),
Titulo = map_chr(all, ~.x$help$title),
Paquete = map_chr(strsplit(sources, "::"), ~.x[[1]]),
Dataset = map_chr(strsplit(sources, "::"), ~.x[[2]])
)pkgs <- tibble(
Nombre = map_chr(all, ~.x$df$name),
Titulo = map_chr(all, ~.x$help$title),
Paquete = map_chr(strsplit(sources, "::"), ~.x[[1]]),
Dataset = map_chr(strsplit(sources, "::"), ~.x[[2]])
)pkgs %>%
arrange(Paquete, Dataset) %>%
knitr::kable()
```Los datos para practicar la manipulación de cadenas (_strings_) son `oraciones`, `palabras` y `frutas`.
## Uso
El paquete `datos` se carga igual que todos los paquetes de R:
```{r}
library(datos)
library(ggplot2)
library(dplyr)
```Las variables que contienen los datos van a estar disponibles inmediatamente para su uso, pero los datos no se traducirán hasta que la variable sea "llamada" explícitamente en el código que se escriba. En este ejemplo, el _dataset_ `diamantes`, que proviene de `ggplot2::diamonds`, se carga en la memoria de R en el momento en que lo llamamos por primera vez en español:
```{r}
glimpse(diamantes)
```Los datos traducidos quedarán cargados durante toda la sesión de R:
```{r, eval = FALSE}
diamantes %>%
filter(corte == "Bueno") %>%
ggplot() +
geom_boxplot(aes(claridad, precio, fill = claridad)) +
theme(legend.position = "none") +
labs(title = "Diamantes", subtitle = "Precio y claridad")
```