Publications by Jairo A. Ayala Godoy

Ejercicio de limpieza de datos

22.03.2023

¿Qué vamos a aprender? En estas próximas clases vamos a trabajar ejercicios sobre limpieza de datos, donde practicaremos algunas funciones del preprocesamiento de datos, como lo son: Estructurar información. Explorar y manipular datos. Planificar variables. Alternativas para manejo de bases de datos “complejas”. ¿Qué paquetes vamos a ...

6430 sym R (9691 sym/60 pcs) 3 img

EjemploPCA

28.02.2023

Teoría Introducción Análisis de componentes principales es un método estadístico que permite simplificar la complejidad de espacios muestrales con muchas dimensiones a la vez que conserva su información. Supóngase que existe una muestra con \(n\) individuos cada uno con \(p\) variables \((X_1,X_2,\dots,X_p)\), es decir, el espacio ...

6256 sym 5 img 3 tbl

Ejemplo1

26.02.2023

Atributos individuales de Puerto Rico 2013-2022...

55 sym

Ejemplo2

26.02.2023

Atributos individuales de Puerto Rico 2013-2022...

55 sym

Implementation_R

09.11.2022

https://www.sedona.cloud/members/JairoAyalaGodoy ¿Qué es R? R es un lenguaje de programación y un entorno para el análisis estadístico y gráfico. R es parte del sistema GNU y se distribuye bajo la licencia GNU GPL; es decir, es un software libre y gratuito. Es multiplataforma: está disponible para Windows, Macs y Linux. R fue creado...

12676 sym R (6212 sym/50 pcs) 13 img 6 tbl

KNN

20.04.2020

K-NN El método K-NN es un métodos más importantes de clasificación supervisada. En el proceso de aprendizaje no se hace ninguna suposición acerca de la distribución de las variables predictoras, es por ello que es un método de clasificación no paramétrico, que estima el valor de la función de densidad de probabilidad o directamente l...

9453 sym R (7112 sym/45 pcs) 3 img

ROC

31.03.2020

Preliminares El aprendizaje supervisado es una técnica usada en minería de datos, en la que se genera una función de pronóstico a partir del entrenamiento previo sobre datos etiquetados. Es decir, aprendemos a partir de casos reales y extrapolamos el resultado a los casos futuros. El proceso habitual consiste en dividir la muestra en dos c...

7479 sym R (4170 sym/37 pcs) 6 img 2 tbl

CMP

24.03.2020

Continuación de métodos de particionamiento Como vimos en la sección anterior, los algoritmos de particionamiento son enfoques de agrupamiento que dividen los conjuntos de datos, que contienen \(n\) observaciones, en un conjunto de \(k\) grupos (es decir, conglomerados). Los algoritmos requieren que el analista especifique el número de cl�...

6272 sym R (6346 sym/33 pcs) 21 img

Métodos de particionamiento

19.03.2020

Métodos de particionamiento Suponemos ahora que tenemos una idea de cuántos grupos hay. Esto es, si tenemos una base de datos pequeña o si es muy grande, tomamos una muestra aleatoria significativa y en cualquiera de los dos casos, realizamos un análisis jerárquico previo con todos estos datos. Por lo tanto, tenemos alguna idea de cuánto...

16996 sym R (7157 sym/24 pcs) 13 img

Análisis de Conglomerados

12.03.2020

Análisis de Conglomerados En la literatura estadística recibe el nombre de Cluster Analysis, o en español Análisis de Conglomerados. En la literatura de Inteligencia Artificial se utiliza la expresión clasificación no supervisada. La idea general es que tenemos una muestra de observaciones multivariada, y deseamos agruparla en grupos. Muy...

17873 sym R (1919 sym/18 pcs) 17 img 7 tbl