guía para la visualización de datos: r

42
Universidad de La Salle Universidad de La Salle Ciencia Unisalle Ciencia Unisalle Recursos bibliográficos Dirección de Bibliotecas 2020 Guía para la visualización de datos: R Guía para la visualización de datos: R Follow this and additional works at: https://ciencia.lasalle.edu.co/recursos_bibliograficos Recommended Citation Recommended Citation "Guía para la visualización de datos: R" (2020). Recursos bibliográficos. 29. https://ciencia.lasalle.edu.co/recursos_bibliograficos/29 This Recurso interactivo is brought to you for free and open access by the Dirección de Bibliotecas at Ciencia Unisalle. It has been accepted for inclusion in Recursos bibliográficos by an authorized administrator of Ciencia Unisalle. For more information, please contact [email protected].

Upload: others

Post on 06-Jul-2022

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Guía para la visualización de datos: R

Universidad de La Salle Universidad de La Salle

Ciencia Unisalle Ciencia Unisalle

Recursos bibliográficos Dirección de Bibliotecas

2020

Guía para la visualización de datos: R Guía para la visualización de datos: R

Follow this and additional works at: https://ciencia.lasalle.edu.co/recursos_bibliograficos

Recommended Citation Recommended Citation "Guía para la visualización de datos: R" (2020). Recursos bibliográficos. 29. https://ciencia.lasalle.edu.co/recursos_bibliograficos/29

This Recurso interactivo is brought to you for free and open access by the Dirección de Bibliotecas at Ciencia Unisalle. It has been accepted for inclusion in Recursos bibliográficos by an authorized administrator of Ciencia Unisalle. For more information, please contact [email protected].

Page 2: Guía para la visualización de datos: R

GUÍA PARA LA VISUALIZACIÓN DE DATOS: R

Dirección de BibliotecasVig

ila

da

Min

ed

uca

ció

n

Page 3: Guía para la visualización de datos: R

BienvenidosR CONCEPTOS BÁSICOS

Nota aclaratoria: Esta guía es solo una revisión básica de R como aplicación para visualizar datos.

2

Page 4: Guía para la visualización de datos: R

3

Tabla de contenido

1. ¿Qué es R? 4

2. Cómo funciona R 6

3. Cómo instalar R 8

4. Crear y eliminar objetos en R 12

5. Manejando datos con R 17

6 Haciendo gráficos con R 31

Page 5: Guía para la visualización de datos: R

¿QUÉ ES R?

4

1

Page 6: Guía para la visualización de datos: R

DEFINICIÓN DE LA APLICACIÓN R

R es un programa o un lenguaje que permite realizar análisis estadísticos y gráficos a partir de una serie de datos. Fue creado por Ross Ihaka y Robert Gentleman, dos profesionales del Departamento de estadística de la Universidad de Auckland Nueva Zelanda. R es un proyecto similar al lenguaje S (programa estadístico) de carácter GNU (General PublicLicence) lo que hace gratuita su adquisición.

Por otra parte, existe la interfaz RStudio que es un entorno de desarrollo integrado en el cual se puede operar R de manera más cómoda en ciertos aspectos.

5

Page 7: Guía para la visualización de datos: R

CÓMO FUNCIONA R

6

2

Page 8: Guía para la visualización de datos: R

FUNCIONAMIENTO DE LA APLICACIÓN R

R es un lenguaje Orientado a Objetos lo que hace, dentro de este concepto, que sea una lenguaje simple y flexible. De ahí que R no tiene que generar preocupación en personas que sienten no tener habilidades de programadores. R es un lenguaje interpretado y no compilado de tal manera que los comandos escritos de forma sencilla son obedecidos por R sin necesidad de construir ejecutables.

Todas las operaciones que R ejecuta con objetos se guardan en la memoria RAM del computador y no utiliza archivos temporales lo que mejora el rendimiento. Según Paradis, E. (2003) “La lectura y escritura de archivos solo se realiza para la entrada y salida de datos y resultados (gráficas). El usuario ejecuta las funciones con la ayuda de comandos definidos. Los resultados se pueden visualizar directamente en la pantalla” (p. 5).

7

Page 9: Guía para la visualización de datos: R

CÓMO INSTALAR R

8

3

Page 10: Guía para la visualización de datos: R

INSTALACIÓN DE LA APLICACIÓN R

Ingrese en el sitio Web: https://cran.r-project.org/index.html

Seleccione la opción Descargar de acuerdo con su sistema operativo, para esta guía se descargará para Windows.

9

Page 11: Guía para la visualización de datos: R

INSTALACIÓN DE LA APLICACIÓN R

Seleccione la opción “install R for the first time”

10

Seleccione la opción “Download R 3.6.3 for Windows”

Page 12: Guía para la visualización de datos: R

INSTALACIÓN DE LA APLICACIÓN R

Ingrese en el explorador de Windows de su computador y busque el archivo descargado con el nombre: R-3.6.3-win y ejecútelo.

11

Siga todos los pasos de la instalación hasta finalizar. En su escritorio debe encontrar el acceso directo a R

Page 13: Guía para la visualización de datos: R

CREAR Y ELIMINAR OBJETOS EN R

12

4

Page 14: Guía para la visualización de datos: R

TRABAJANDO CON R

Para crear un objeto en R se utiliza uno de los “Operadores de Asignación” que es: < -el cual se denota con el operador “menor que” seguido del signo “menos”.

13

Ingrese a R, cree y asigne valores a los objetos a, b y c.

Una vez asignado el valor a cada objeto basta con digitar el nombre del objeto para recuperar el valor.

Page 15: Guía para la visualización de datos: R

TRABAJANDO CON R

También se pueden crear objetos en R con el resultado de operaciones o con funciones como muestra el ejemplo siguiente:

14

Las operaciones básicas se pueden realizar en R con los siguientes operadores binarios. Se denomina binarios ya que operan entre dos objetos de R:

Page 16: Guía para la visualización de datos: R

TRABAJANDO CON R

Si se desea saber cuáles objetos hay en la memoria se utiliza la

función ls()

La función ls.str() recupera los objetos con su respectivo valor e identifica el tipo de dato, en este caso todos son numéricos.

15

Page 17: Guía para la visualización de datos: R

TRABAJANDO CON R

Si se desea borrar los objetos residentes en la memoria de R se utiliza la función rm(). Esta función se puede utilizar para eliminar de a un objeto simplemente nombrándolo

dentro de la función, por ejemplo para borrar el objeto “a” se digita rm(a); se pueden eliminar varios al tiempo, por ejemplo para eliminar los objetos “a” y “b” se digita

rm(a,b) y si se desea eliminar todos los objetos de la lista se digita rm(list=ls()).

.

16

Page 18: Guía para la visualización de datos: R

MANEJANDO DATOS CON R

17

5

Page 19: Guía para la visualización de datos: R

MANEJANDO DATOS CON R

Antes de iniciar las operaciones con R es necesario saber cuáles tipos de Objetos se pueden procesar en R. Existen varios tipos de objetos como los vectores, matrices, arreglos, marcos de datos y listas, entre otros. Para esta guía solo se describirán los vectores y las matrices.

.

18

Page 20: Guía para la visualización de datos: R

VECTORES

Los vectores son listas ordenadas en las cuales se puede almacenar información de tipo numérica, alfanumérica o lógica; pero no la mezcla de estas. La función

en R para crear un vector es C() , que significa concatenar; la información se digita dentro de los paréntesis. El vector casi siempre se nombra de manera corta y fácil que represente la información. Ejemplos:

19

Page 21: Guía para la visualización de datos: R

MATRICES

Una matriz en un arreglo rectangular compuesto por filas y columnas que contiene información numérica, alfanumérica o lógica. En R la función para crear una matriz es

matrix(). Dentro de la función Matriz existen varios argumentos que ayudan a su

construcción, el primero es data que se utiliza para indicar los datos almacenados en

la matriz, el segundo es nrow que indica el número de filas, el tercero es ncol que

indica el número de columnas y por último byrow indica si la información descrita en data se debe ingresar por filas o no.

20

Page 22: Guía para la visualización de datos: R

MATRICES

21

Para el ejemplo ingrese a R y cree una matriz de 4 X 5 con los primeros 20 dígitos positivos:

Page 23: Guía para la visualización de datos: R

Leer datos externos en R

22

En esta Guía se explicará cómo leer información con datos en dos formatos:

Plano con extensión .txt

Excel con extensión .csv

Con el propósito de practicar como se hace la lectura de estos dos tipos de formatos en R, por favor elabore la siguiente base de datos en Excel con las tres variables que se indican ya que servirá de ejemplo.

Page 24: Guía para la visualización de datos: R

LEER DATOS EXTERNOS EN R

23

Ahora es necesario guardar la información en los dos tipos de extensión de archivos que se han nombrado anteriormente.

No le ponga bordes ni colores a las celdas, deje sólo la información e los datos sin darle otro tipo de formato. En el menú archivo guarde la información con el nombre base-datos y elija en tipo la opción CSV (delimitado por comas).

Luego abra el block de notas y copie los datos incluyendo los títulos de cada columna, verifique que los espacios entre un dato y otros estén separados con la barra espaciadora:

Page 25: Guía para la visualización de datos: R

Leer datos externos en RLa Función read.table

24

Esta es la función que utiliza R para leer los datos de la información que se ha guardado en los formatos que anteriormente se practicaron. Esta función está compuesta de varios argumentos para esta guía solo se trabajarán con 4 que se explican a continuación:

file: es el nombre o la ruta en al cual están alojados los datos. Se puede utilizar una dirección URL o una dirección del computador.

header: es un argumento lógico, se utiliza TRUE cuando la primera fila de la base de datos o tabla lleva los títulos de las variables, de lo contrario se pone FALSE.

Page 26: Guía para la visualización de datos: R

25

sep: se refiere al tipo de separación interna de los datos de la base de datos o tabla. Los valores asigandos para este arugmento son:

sep=',' si el archivo tiene extensión .csv.

sep= ' ' si el archivo es bloc de notas con espacios por la barra espaciadora.

sep='\t' si el archivo es bloc de notas con espacios por la barra tabuladora

dec: es el símbolo con el cual se indican los decimales.

Ahora ingrese en R y recupere los datos almacenados en Excel y block de notas

Leer datos externos en RLa Función read.table

Page 27: Guía para la visualización de datos: R

26

Haga lo mismo para los datos almacenado como texto en el bloc de notas

Leer datos externos en RLa Función read.table

Page 28: Guía para la visualización de datos: R

LEER BASES DE DATOS DE EXCEL EN R

27

Es bien sabido que la mayoría de veces ya se tiene información con los datos almacenados en Excel, R cuenta con un paquete que permite acceder a los datos que contienen los archivos de Excel. Este paquete se denomina readxl , que a su vez contiene la función read_excel.

Para utilizar este paquete en R es necesario instalarlo por una sola vez con la función de R para la instalación de paquetes que es: install.packages, ingrese a R e instale el paquete digitando como aparece en la imagen:

Page 29: Guía para la visualización de datos: R

LEER BASES DE DATOS DE EXCEL EN R

28

Una vez instalado el paquete se debe llamar para cada sesión de R con el comando: Library

Ahora ingrese en Excel y cree un archivo con los datos que aparecen en las imágenes a continuación, póngale el nombre Hijos a la hoja de trabajo:

Page 30: Guía para la visualización de datos: R

LEER BASES DE DATOS DE EXCEL EN R

29

Guarde el archivo de Excel con el nombre “BD_Excel” en una carpeta que usted pueda identificar.Luego de haber instalado el paquete read_xl y con la creación de la base de datos en Excel, ingrese en R y lea la información contenida en la base de datos de Excel con la función read_excel.

Digite en R la instrucción: hijos <-read_excel(file.choose(), sheet='Hijos') y de clic en énter, se abrirá una ventana para que ubique el archivo de Excel con los datos, encuentre el archivo y selecciones la opción abrir:

Page 31: Guía para la visualización de datos: R

LEER BASES DE DATOS DE EXCEL EN R

30

Para visualizar al información digite: as.data.frame(hijos)

La función read_excel tiene otrosparámetros adicionales útiles para leerbases de datos, se recomiendaconsultar la ayuda de la funciónescribiendo en la consolahelp(read_excel).

Page 32: Guía para la visualización de datos: R

HACIENDO GRÁFICOS CON R

31

6

Page 33: Guía para la visualización de datos: R

HACIENDO GRÁFICOS CON R

32

R presenta gran variedad de opciones para graficar datos obtenidos de información externa o registrada directamente en el programa. Para esta guía se describirá como hacer un gráfico con el comando básico.

Inicialmente, para activar la ventana en la cual se visualizan las gráficas se debe digitar llamar en R el comando x11( )

Page 34: Guía para la visualización de datos: R

33

Ahora ingrese a Excel y cree un archivo con los datos de la imagen y guárdelo con el nombre “prueba”

Recupere el archivo en R con la instrucción dada en “Leer Bases de Datos de Excel en R”.

HACIENDO GRÁFICOS CON R

Page 35: Guía para la visualización de datos: R

34

Ponga de nombre el objeto “grafica” y digite la instrucción y busque el archivo “prueba” donde lo guardó.

Visualice los datos que se recuperaron del archivo con el comando as.data.frame(grafica)

HACIENDO GRÁFICOS CON R

Page 36: Guía para la visualización de datos: R

35

El tipo de gráfica que se describirá en esta guía se obtiene con la función de R llamada “plot()”. Entonces ahora digite en R plot(grafica) y haga clic en la tecla énter.

HACIENDO GRÁFICOS CON R

Page 37: Guía para la visualización de datos: R

36

Como se observa, R inteligentemente toma por defecto el rango de pares ordenados que se digitó en la tabla de Excel; es decir, tomó para el eje x de la gráfica los datos de la columna “días” y para el eje y de la gráfica los datos de la columna “casos”, y luego dibuja un circulo en la intersección de cada par ordenado. R tiene varios comandos y parámetros que pueden darle características especiales a las gráficas dependiendo del tipo de gráfica y las necesidades para presentar una buena ilustración.

Por ejemplo para unir los puntos de la gráfica anterior con una línea basta con digitar el lines( ) escribiendo dentro del paréntesis del comando el nombre del objeto, en este caso “grafica” como se observa en la siguiente imagen:

HACIENDO GRÁFICOS CON R

Page 38: Guía para la visualización de datos: R

37

HACIENDO GRÁFICOS CON R

Page 39: Guía para la visualización de datos: R

38

Para conocer los parámetros que se pueden utilizar en las gráficas digite la instrucción

?par en el tablero de R. A continuación se relaciona una lista de los más comunes:

Fuente: R para principiantes. Emanuel Paradis

HACIENDO GRÁFICOS CON R

Page 40: Guía para la visualización de datos: R

39

Un parámetro relevante en el diseño de gráficas es el título que no aparece en este listado y que

se obtiene en R con el parámetro main

A continuación digite las instrucciones de la imagen para modificar la gráfica obtenida:

Como se observa en esta gráfica ya aparece el título, la línea de color azul y los círculos de las intersecciones de color rojo.

HACIENDO GRÁFICOS CON R

Page 41: Guía para la visualización de datos: R

CRAN (2020) The Comprehensive R Archive Network. https://cran.r-project.org/

Hernández, F. & Usuga, O. (2020). Manual de R. https://fhernanb.github.io/Manual-de-R/

Paradis, E. (2003). R para Principiantes. Institut des Sciences de l’Evolution Universit Montpellier, France. https://cran.r-project.org/doc/contrib/rdebuts_es.pdf

40

Referencias

Page 42: Guía para la visualización de datos: R

GraciasEsta guía fue compilada por Henry Vargas Pacheco

Para mayor información escribe al correo: [email protected]

Iconos y gráficos: https://www.flaticon.com/http://www.slidescarnival.com/es

41Este material es propiedad de la Universidad de La Salle