Publications by Jairo A. Ayala Godoy

Estadística Aplicada en Ciencias Naturales

18.10.2024

jairoarturo.ayala@upr.edu Introducción La estadística se ha convertido en una disciplina esencial, especialmente en áreas que requieren la toma de decisiones fundamentada en datos, como las ciencias naturales, ciencias sociales, administración de empresas, ingeniería, entre otras. No obstante, la enseñanza de la estadística enfrenta va...

6059 sym 2 img

ENME-UT_Dia2

05.09.2024

\[ \] R Markdown es una sintaxis de formato simple para crear reportes elegantes. Utiliza un lenguaje llamado Markdown para enriquecer el informe final. Este permite incluir texto, fórmulas matemáticas, comandos de R, imágenes y gráficos a un documento. Para obtener más detalles sobre el uso de RMarkdown, consulte http://rmarkdown.rstudi...

4791 sym R (1496 sym/17 pcs) 14 img 1 tbl

Introducción a la minería de texto

24.04.2024

Introducción La minería de texto es un campo de la ciencia de datos que se centra en extraer información útil y conocimiento significativo a partir de grandes cantidades de texto no estructurado. Con el auge de la digitalización y la disponibilidad masiva de datos en forma de documentos, correos electrónicos, publicaciones en redes socia...

8179 sym Python (12098 sym/36 pcs) 8 img

Máquinas de vector soporte

10.04.2024

Introducción Las Máquinas de vector soporte Vectorial (Support Vector Machines SVMs) son un conjunto de algoritmos de aprendizaje supervisados que desarrollan métodos relacionados con los problemas de clasificación y regresión. Originariamente se desarrollaron como un método de clasificación binaria, pero su aplicación se ha extendido ...

17821 sym R (4550 sym/37 pcs) 11 img

Visualización de datos

10.02.2024

Introducción Las visualizaciones en el campo de la minería de datos son esenciales para comprender patrones, tendencias y relaciones ocultas en conjuntos de datos complejos. Estas visualizaciones pueden variar desde gráficos simples hasta visualizaciones interactivas avanzadas, dependiendo de la complejidad de los datos y los objetivos del ...

5816 sym R (2988 sym/21 pcs) 1 img 3 tbl

Limpieza de datos (continuación)

03.02.2024

Continuando con el tema de limpieza de datos, haremos una lista de funciones de la familia de librerías denominada: tidyverse. Vale la pena resaltar que esta librería es un compendido de muchas librerías de las cuales algunas mencionamos la clase pasada (tidyr,dplyr,tibble,stringr,ggplot2,purr,magrittr, etc) Funciones principales Funció...

10734 sym 4 img 5 tbl

Limpieza de datos

30.01.2024

Introducción El análisis de datos siempre debe comenzar con un proceso de limpieza de datos que forma parte del preprocesamiento fundamental para cualquier análisis posterior, teniendo certeza de contar con datos eficientes, precisos y efectivos. Limpiar datos conlleva a analizar, identificar y corregir los datos “crudos” que están des...

12138 sym R (3766 sym/25 pcs) 14 img 2 tbl

Análisis de Correlación Canóninca

03.12.2023

Introducción El análisis de correlación canónico (CCA, por sus siglas en inglés), es una tecnifica estadística del análisis multivariado. Se utiliza cuando se desea dividir el conjunto de variables en dos grupos para estudiar la relación existente entre estos. En el análisis de regresión múltiple se mide la relación entre un conju...

11547 sym R (9718 sym/55 pcs) 9 img

Análisis Discriminante

26.11.2023

Introducción El análisis discriminante (DA por sus siglas en inglés Discriminat analysis) es una técnica multivariada que se encarga primero de separar o discriminar la información en grupos, y segundo, trabaja en la predicción o asignación de un objeto nuevo en uno de los diferentes grupos previamente encontrados, con base en los valo...

21847 sym R (6786 sym/47 pcs) 12 img 2 tbl

Análisis Factorial Exploratorio

08.11.2023

Introducción El análisis factorial exploratorio (EFA por sus siglas en inglés Exploratory factor analysis) es una poderosa técnica estadística que se utiliza en diversas disciplinas para explorar la estructura subyacente de un conjunto de variables observadas. Su principal objetivo es identificar y describir factores latentes que explica...

20819 sym R (3202 sym/32 pcs) 16 img 6 tbl