Publications by Lisset A01284611
Actividad 1 - Módulo 3
Instrucciones Seleccionar una de las dos opciones de bases de datos i) automobile_insurance_claims o ii) health_insurance. A partir de dicha selección realizar las instrucciones 1 – 5. En el desarrollo del archivo de R-Markdown, por favor incluir data storytelling de los resultados del análisis exploratorio de los datos (EDA) así como la inter...
8775 sym R (19977 sym/122 pcs) 20 img
8 Puntos - Segmentación
Contexto La segmentación o clusters es un conjunto de técnicas cuyo propósito es formar grupos a partir de un conjunto de elementos. Más información: R for Data Science (2ed) Paso 1. Instalar paquetes y llamar librerias #install.packages("cluster") library(cluster) #install.packages("ggplot2") library(ggplot2) #install.packages("data.table") ...
3140 sym R (1118 sym/9 pcs) 3 img
8 Puntos
Contexto La segmentación o clusters es un conjunto de técnicas cuyo propósito es formar grupos a partir de un conjunto de elementos. Más información: R for Data Science (2ed) Paso 1. Instalar paquetes y llamar librerias #install.packages("cluster") library(cluster) #install.packages("ggplot2") library(ggplot2) #install.packages("data.table") ...
3139 sym R (1166 sym/9 pcs) 3 img
Clusters - 8 Puntos
Contexto La segmentación o clusters es un conjunto de técnicas cuyo propósito es formar grupos a partir de un conjunto de elementos. Más información: R for Data Science (2ed) Paso 1. Instalar paquetes y llamar librerías #install.packages("cluster") library(cluster) #install.packages("ggplot2") library(ggplot2) #install.packages("data.table")...
3139 sym R (1166 sym/9 pcs) 3 img
Titanic - árbol de decisión
# Contexto El siguiente ejercicio implica la creación de un árbol de decisión utilizando una base de datos del Titanic. El objetivo es determinar la probabilidad de supervivencia según el género y la clase de los pasajeros. Importar la base de datos # file.choose() library(readxl) titanic <- read_xls("/Users/lishdz/Downloads/Titanic.xls") ## ...
2846 sym R (5061 sym/17 pcs) 3 img
Redes Neuronales
Introducción Una Red Neuronal Aritificial (ANN) modela la relación entre un conjunto de entradas y una salida, resolviendo un problema de aprendizaje. Algunos ejemplos de ANN son: * Recomendaciones de contenido de Netflix. * El feed de Instagram. * Determinar el número escrito a mano. Ejercicio 1. ¿Pasé la materia? 1. Instalar paquetes y lla...
4023 sym R (1194 sym/13 pcs) 3 img
Regresión Lineal
Instalar paquetes y llamar librerías library(tidyverse) ## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ── ## ✔ dplyr 1.1.3 ✔ readr 2.1.4 ## ✔ forcats 1.0.0 ✔ stringr 1.5.0 ## ✔ ggplot2 3.5.0 ✔ tibble 3.2.1 ## ✔ lubri...
1979 sym R (5617 sym/13 pcs) 1 img
Regresión Lineal - WalMart
Introducción La regresión lineal es un modelo que permite analizar la relación lineal entre una variable dependiente y múltiples variables independientes o explicativas. En esta actividad se utilizará para predecir las ventas semanales de Walmart. Instalar paquetes y llamar librerías library(tidyverse) ## ── Attaching core tidyverse pack...
2577 sym R (5617 sym/13 pcs) 1 img
Text Mining
La minería de texto (TM) es el proceso de extraer información útil, patrones o conocimiento de textos no estructurados. Consta de tres etapas: 1. Obtener datos: El reconocimiento óptico de caracteres (OCR) es un tecnologia que permite convertir imágenes de texto en texto editable.También es conocido como extracción de texto de imágenes. 2. ...
10671 sym R (27945 sym/52 pcs) 5 img
Data Explorer
La librería Data Explorer es la más conocida para el análisis exploratorio. Es muy simple de usar y muy poderosa, pues ofrece como salida un informe con mucha información. La función para crear el informe es create_report(), y para ver cada gráfica de forma individual, las funciones son: introduce() plot_intro() plot_boxplot() plot_missing()...
3110 sym R (1215 sym/13 pcs) 9 img