Publications by Fernando López-Torrijos

Visualización de transiciones

17.01.2020

Introducción Se realizaron entrevistas abiertas semi-estructuradas, en profundidad, a docentes con el objetivo de analizar sus discursos, para proceder luego a su interpretación. Se trató de un método puramente cualitativo. El propósito era evaluar el fortalecimiento de las prácticas pedagógicas de los docentes para el desarrollo de compet...

4312 sym 2 img 2 tbl

Penalized linear regression for predictive modeling

06.01.2020

Linear regressions are adequate to describe the relationships between the variables in a database. However, when it is intended to predict, there is a limitation that, by philosophy, regressions fit data that is analyzed, and better the adjustment to the data analyzed, less likely the prediction is useful to another data set. The adjustment is us...

6786 sym R (3270 sym/3 pcs) 3 img 1 tbl

Critical reading in technology level education in Bogotá. Linear Mixed Models.

06.01.2020

Colombia’s Institute for educational evaluation (ICFES) evaluates the quality of technical and technological education through the TyT tests that are applied to students who have completed at least 75% of the credits of the program in which they are enrolled. This test evaluates five generic skills, among which is the critical reading competenc...

9573 sym 1 img 3 tbl

Exploración del uso del tiempo mediante RCMP - biplot

17.01.2020

Introducción El presente ejercicio realiza el análisis del uso del tiempo de los colombianos mayores de 10 años a partir de los datos de la Encuesta Nacional de Uso del Tiempo ENUT Colombia 2012-2013. Se desea observar el comportamiento por grupos de edad según el estrato socioeconómico de la vivienda y sexo. Se unen en un sólo análisis gr...

10599 sym 10 img 2 tbl

El ecosistema tidymodels

07.07.2020

Hadley Wickham y Garrett Grolemund escribieron un difundido libro denominado R for Data Science que explica las bases del lenguaje para realizar exploración de datos, data wrangling y algo de programación. Terminan el libro con las bases del modelamiento predictivo. Para aquellos que saben de Ciencia de datos el texto deja la sensación de que ...

6084 sym 2 img

Ejemplo de uso del paradigma tidymodels

08.08.2020

¿Como modelar con tidymodels? Se presentan algunos ejemplos de modelos de clasificación no lineales para que se pueda observar la utilización del nuevo conjunto de herramientas para Ciencia de Datos. Primer ejemplo Para el ejemplo inicial se ha transcrito, con importantes ajustes, la explicación asociada a un comando de rsample1, la cual uti...

12669 sym R (12222 sym/53 pcs) 8 img

Machine Learning sobre Series de tiempo

19.08.2020

Introducción Se lee un archivo Excel con 129,373 registros. Se trata de una serie de tiempo de tres años, con el número de accidentes por día en vías. Las variables tipo fecha usualmente permiten crear nuevas features de tipo categórico, necesarias para los modelos de predicción. El paquete timetk tiene una receta estilo recipes del paradi...

5239 sym R (4124 sym/18 pcs) 2 img

Random sample consensus

12.04.2021

Introducción Random sample consensus (RANSAC) es una heurística (algoritmo iterativo) para calcular los parámetros de un modelo de regresión lineal sobre un conjunto de datos observados que contiene valores atípicos. Es no determinista en el sentido de que produce un resultado razonable solo con una cierta probabilidad, mayor a medida que se...

5155 sym R (4586 sym/23 pcs) 15 img 1 tbl

Análisis de Anomalías Parte 1

24.05.2021

Fernando López-Torrijos Flórez y Jose Fernando Zea Castro. Prólogo En estadística se denomina detección de outliers, haciendo uso del término anglosajón. En ciencias de la computación se denomina detección de datos anómalos o minería de excepciones. En español se define anomalía como “Desviación o discrepancia de una regla o de u...

12936 sym R (1194 sym/3 pcs) 10 img 5 tbl

Análisis de Anomalías Parte 2

24.05.2021

Fernando López-Torrijos Flórez y Jose Fernando Zea Castro. Regresión lineal El modelo de regresión lineal para muchas variables toma la siguiente forma: \[y=\beta_0 + \beta_1 x_1 + \beta_2 x_2 + \dots + \beta_p x_p\], donde: y es la respuesta \(\beta_0\) es el intercepto \(\beta_1\) es el coeficiente asociado a \(x_1\) \(\dots\) \(\beta_p\)...

3402 sym R (1151 sym/10 pcs) 5 img 1 tbl