Publications by Jairo A. Ayala Godoy
Clasificador Bayesiano
Introducción El clasificador Bayesiano también conocido como Naive Bayes es uno de los clasificadores más utilizados por su simplicidad y rapidez. Se trata de una técnica de clasificación y predicción supervisada que construye modelos que predicen la probabilidad de posibles resultados, con base en el Teorema de Bayes. Se basa en la sup...
9914 sym R (8409 sym/38 pcs) 3 img 7 tbl
Árboles de decisión
Introducción Los árboles de decisión o de clasificación son modelos predictivos formados por reglas sencillas de la forma: “si… entonces…”, con las que se consigue repartir las observaciones en función de sus atributos y predecir así el valor de la variable respuesta. Los métodos basados en árboles se han convertido en uno de lo...
13821 sym R (5686 sym/29 pcs) 10 img
K-Vecinos más cercanos (K-NN)
Introducción La clasificación supervisada es una de las técnicas más importantes dentro del aprendizaje automático, con aplicaciones prácticas en diversas áreas como la banca, medicina, mercadeo, entre otras. Uno de los métodos más intuitivos, sencillos y efectivos para la clasificación supervisada es el algoritmo K-Vecinos más Cerca...
13329 sym R (8681 sym/42 pcs) 5 img 5 tbl
Transformando la Enseñanza de la Estadística: Integración de Recursos Digitales
Motivación ¿Qué debemos hacer para que la estadística sea más atractiva y relevante para los estudiantes? El verdadero reto no es enseñar estadística, sino lograr que los estudiantes la comprendan y la usen correctamente. Si seguimos enseñando estadística como hace 20 años, estamos preparando a los estudiantes para un mundo que ya no exi...
3954 sym 4 img
Manejo de datos faltantes
Introducción Los datos faltantes se entienden como valores que debían haberse registrado, pero no lo hicieron. Es importante comprender cómo lidiar con ellos, ya que pueden tener efectos muy relevantes en los análisis que se realicen. La pérdida de datos necesariamente conlleva a la pérdida de información y por lo tanto, a una menor pre...
6154 sym R (4532 sym/10 pcs) 3 img
Estadística Aplicada en Ciencias Naturales
jairoarturo.ayala@upr.edu Introducción La estadística se ha convertido en una disciplina esencial, especialmente en áreas que requieren la toma de decisiones fundamentada en datos, como las ciencias naturales, ciencias sociales, administración de empresas, ingeniería, entre otras. No obstante, la enseñanza de la estadística enfrenta va...
6059 sym 2 img
ENME-UT_Dia2
\[ \] R Markdown es una sintaxis de formato simple para crear reportes elegantes. Utiliza un lenguaje llamado Markdown para enriquecer el informe final. Este permite incluir texto, fórmulas matemáticas, comandos de R, imágenes y gráficos a un documento. Para obtener más detalles sobre el uso de RMarkdown, consulte http://rmarkdown.rstudi...
4791 sym R (1496 sym/17 pcs) 14 img 1 tbl
Introducción a la minería de texto
Introducción La minería de texto es un campo de la ciencia de datos que se centra en extraer información útil y conocimiento significativo a partir de grandes cantidades de texto no estructurado. Con el auge de la digitalización y la disponibilidad masiva de datos en forma de documentos, correos electrónicos, publicaciones en redes socia...
8179 sym Python (12098 sym/36 pcs) 8 img
Máquinas de vector soporte
Introducción Las Máquinas de vector soporte Vectorial (Support Vector Machines SVMs) son un conjunto de algoritmos de aprendizaje supervisados que desarrollan métodos relacionados con los problemas de clasificación y regresión. Originariamente se desarrollaron como un método de clasificación binaria, pero su aplicación se ha extendido ...
17821 sym R (4550 sym/37 pcs) 11 img
Visualización de datos
Introducción Las visualizaciones en el campo de la minería de datos son esenciales para comprender patrones, tendencias y relaciones ocultas en conjuntos de datos complejos. Estas visualizaciones pueden variar desde gráficos simples hasta visualizaciones interactivas avanzadas, dependiendo de la complejidad de los datos y los objetivos del ...
5816 sym R (2988 sym/21 pcs) 1 img 3 tbl