Publications by Jairo A. Ayala Godoy
Ejercicio de limpieza de datos
¿Qué vamos a aprender? En estas próximas clases vamos a trabajar ejercicios sobre limpieza de datos, donde practicaremos algunas funciones del preprocesamiento de datos, como lo son: Estructurar información. Explorar y manipular datos. Planificar variables. Alternativas para manejo de bases de datos “complejas”. ¿Qué paquetes vamos a ...
6430 sym R (9691 sym/60 pcs) 3 img
EjemploPCA
Teoría Introducción Análisis de componentes principales es un método estadístico que permite simplificar la complejidad de espacios muestrales con muchas dimensiones a la vez que conserva su información. Supóngase que existe una muestra con \(n\) individuos cada uno con \(p\) variables \((X_1,X_2,\dots,X_p)\), es decir, el espacio ...
6256 sym 5 img 3 tbl
Implementation_R
https://www.sedona.cloud/members/JairoAyalaGodoy ¿Qué es R? R es un lenguaje de programación y un entorno para el análisis estadístico y gráfico. R es parte del sistema GNU y se distribuye bajo la licencia GNU GPL; es decir, es un software libre y gratuito. Es multiplataforma: está disponible para Windows, Macs y Linux. R fue creado...
12676 sym R (6212 sym/50 pcs) 13 img 6 tbl
KNN
K-NN El método K-NN es un métodos más importantes de clasificación supervisada. En el proceso de aprendizaje no se hace ninguna suposición acerca de la distribución de las variables predictoras, es por ello que es un método de clasificación no paramétrico, que estima el valor de la función de densidad de probabilidad o directamente l...
9453 sym R (7112 sym/45 pcs) 3 img
ROC
Preliminares El aprendizaje supervisado es una técnica usada en minería de datos, en la que se genera una función de pronóstico a partir del entrenamiento previo sobre datos etiquetados. Es decir, aprendemos a partir de casos reales y extrapolamos el resultado a los casos futuros. El proceso habitual consiste en dividir la muestra en dos c...
7479 sym R (4170 sym/37 pcs) 6 img 2 tbl
CMP
Continuación de métodos de particionamiento Como vimos en la sección anterior, los algoritmos de particionamiento son enfoques de agrupamiento que dividen los conjuntos de datos, que contienen \(n\) observaciones, en un conjunto de \(k\) grupos (es decir, conglomerados). Los algoritmos requieren que el analista especifique el número de cl�...
6272 sym R (6346 sym/33 pcs) 21 img
Métodos de particionamiento
Métodos de particionamiento Suponemos ahora que tenemos una idea de cuántos grupos hay. Esto es, si tenemos una base de datos pequeña o si es muy grande, tomamos una muestra aleatoria significativa y en cualquiera de los dos casos, realizamos un análisis jerárquico previo con todos estos datos. Por lo tanto, tenemos alguna idea de cuánto...
16996 sym R (7157 sym/24 pcs) 13 img
Análisis de Conglomerados
Análisis de Conglomerados En la literatura estadística recibe el nombre de Cluster Analysis, o en español Análisis de Conglomerados. En la literatura de Inteligencia Artificial se utiliza la expresión clasificación no supervisada. La idea general es que tenemos una muestra de observaciones multivariada, y deseamos agruparla en grupos. Muy...
17873 sym R (1919 sym/18 pcs) 17 img 7 tbl