Publications by Hugo Porras

Introducción a las herramientas del tidyverse

19.10.2021

1. Introducción La ciencia de datos es un campo interdisciplinario que involucra métodos científicos, procesos y sistemas para extraer conocimiento a través del entendimiento de datos en sus distintas formas. A través de este cuaderno aprenderás a usar el lenguage de programación R, y en específico, las herramientos del tidyverse, para at...

55660 sym R (2151 sym/29 pcs)

Curso de descubrimiento de patrones

29.09.2021

1. ¿Por qué hacer análisis no supervisado? Dentro de las técnicas de análisis supervisado de regresión y clasificación, usualmente tenemos acceso a un conjunto de variables \(X_1, X_2, ..., X_p\) medidas sobre \(n\) observaciones para predecir una variable de respuesta \(Y\). En el caso del análisis no supervisado, el objetivo es descubr...

7457 sym R (12973 sym/33 pcs) 15 img 1 tbl

Big Data con apache spark desde R

20.09.2021

Introducción a los clusters de computación distribuida Un clúster de computación distribuida consiste en una red formada por varias computadoras que funcionan como un solo sistema. Estos computadores pueden tener múltiples configuraciones, es decir, puede funcionar con varias estaciones de trabajo, computadoras personales, laptops, etc. A l...

2461 sym 3 img

Curso de Análisis de Datos Espaciales con R

16.09.2021

1. Introducción Las notas presentadas en este cuaderno se encuentran inspiradas en el material dictado por la Dra. Carolina Guevara, profesora e investigadora de la Escuela Politécnica Nacional, en la materia de Economía Geográfica. Acorde a William Strange (2005), la aglomeración urbana es la concentración espacial de la actividad económ...

5209 sym R (7257 sym/18 pcs) 3 img

Curso de Análisis de Datos Espaciales con R

14.09.2021

1. Introducción Dentro del análisis de los datos espaciales y la estadística espacial, uno de los conceptos más importantes a conocer es la autocorrelación espacial. Esta suele complicar las pruebas estadísticas y facilitar la interpolación espacial. La autocorrelación (sea esta espacial o temporal) es una medida de similitud (correlaci�...

6985 sym R (7192 sym/51 pcs) 7 img

Curso de Análisis de Datos Espaciales con R

13.09.2021

1. Introducción al análisis de datos espaciales Antes de empezar con el análisis de datos espaciales es esencial que recordemos como funciona un proceso de análisis de datos. ¿Cómo hacemos ciencia con los datos? Para entenderlo revisemos un diagrama: En este podemos observar que todos los datos que utilizamos provienen del mundo real como...

10247 sym R (8037 sym/33 pcs) 8 img

Curso de Análisis de Datos Espaciales con R

13.09.2021

1. Influencia espacial Para analizar datos espaciales, un paso importante suele ser la obtención de una medida de la influencia espacial entre los objetos geográficos. Dicha medida se puede expresar en función de la adyacencia o de ladistancia inversa expresada como una matriz de ponderaciones espaciales. Claro está que esta es una variable ...

4217 sym R (13354 sym/54 pcs) 8 img

Notas Introductorias al Tidyverse: ggplot2

13.09.2021

Prólogo El material de este cuaderno auxiliar está basado en el libro R for Data Science hecho por Hadley Wickham, y dará una breve guía de cómo visualizar datos en R utilizando la librería ggplot2. Además, es el primero de una serie de cuadernos elaborados por Hugo B. Porras destinados a la nivelación de alumnos que buscan realizar aná...

3997 sym R (1743 sym/9 pcs) 4 img

Big Data con apache spark desde R

24.09.2021

K-Means|| Implementado en Spark, y usable a través de las APIs de R y Python, el algoritmo K-Means es uno de los más utilizados desde su época de salida. Es tal su alcance de uso que varias investigaciones han buscado optimizar su uso y procesamiento. Así, uno de sus aspectos cruciales para obtener una solución adecuada es una inicializaci�...

1578 sym 1 img