Publications by Gabriel Medina

IT - TEXT MINING

03.03.2024

Teoría La minería de texto (TM) es el proceso de extraer información útil, patrones o conocimiento de textos no estructurados. Consta de 3 etapas: Obtener datos: El Reconocimiento óptimo de caracteres (OCR) es una tecnología que permite convertir imágenes de texto en texto editable. También es conocido como extracción de texto de imágen...

10676 sym Python (41255 sym/41 pcs) 5 img

Data Explorer

03.03.2024

Data Explorer Teoría La librería Data Explorer es la más conocida para el análisis exploratorio. Es muy simple de usar y muy poderosa, pues ofrece como salida un informe con mucha información. La función para crear el informe es create_report, y para ver cada gráfica de forma individual, las funciones son: introduce() plot_intro() plot_box...

3042 sym 9 img

IRIS - Machine learning

03.03.2024

Teoría El paquete caret (Classification And REgression Training) es un paquete integral con una amplia variedad de algoritmos para el aprendizaje automático. Librerías library(caret) library(ggplot2) # Crear gráficos library(datasets) # Usar la base de datos "Iris" library(lattice) # Crear gráficos library(DataExplorer) library(mlbench) Bas...

9811 sym 4 img

breastcancer

03.03.2024

Librerías library(caret) ## Loading required package: ggplot2 ## Warning: package 'ggplot2' was built under R version 4.2.3 ## Loading required package: lattice library(ggplot2) # Crear gráficos library(datasets) # Usar la base de datos "Iris" library(lattice) # Crear gráficos library(DataExplorer) ## Warning: package 'DataExplorer' was built un...

12021 sym 4 img

8puntos

03.03.2024

Clustering Contexto La segmentación o clusters es un conjunto de técnicas cuyo propósito es formar grupos a partir de un conjunto de elementos. Más información: Cluster Paso 1 - Instalar librerías #install.packages("cluster") library(cluster) #install.packages("ggplot2") library(ggplot2) #install.packages("data.table") library(data.tab...

4374 sym 3 img

wine

03.03.2024

Clustering Contexto Este documento aborda el estudio químico realizado sobre muestras de vino provenientes de tres viñedos distintos en una idéntica zona de Italia, explorando la composición química a través del análisis de trece componentes distintivos en cada variedad de vino. Contenido Etanólico: Mide la proporción de etanol, influenci...

9514 sym 3 img

pase de materia

03.03.2024

Teoría Una Red Neuronal Artificial (ANN) modela la relación entre un conjunto de entradas y una salida, resolviendo un problema de aprendizaje. Algunos ejemplos de aplicación de ANN son: La recomendación de contenido de Netflix. El feed de Instagram. Determinar el número escrito a mano. Paso 1 - librerías #install.packages("neurnalnet") li...

2520 sym 1 img

titanic

03.03.2024

Importar BD library(readxl) titanic <- read_excel("/Users/gabrielmedina/Downloads/M2/titanic.xls") EDA summary(titanic) ## pclass survived name sex ## Min. :1.000 Min. :0.000 Length:1309 Length:1309 ## 1st Qu.:2.000 1st Qu.:0.000 Class :character Class :character ## Me...

2987 sym 3 img

USArrests

21.02.2024

Contexto This data set contains statistics, in arrests per 100,000 residents for assault, murder, and rape in each of the 50 US states in 1973. Also given is the percent of the population living in urban areas Paso 1. Definir librerías #install.packages("cluster") library(cluster) ## Warning: package 'cluster' was built under R version 4.2.3 #ins...

8969 sym Python (6535 sym/20 pcs) 4 img

EVIDENCIA 2 - MINERÍA DE DATOS

02.12.2023

Prediccion de compras en Ecommerce La creciente presencia de las empresas en el entorno digital ha llevado a un auge en el comercio electrónico, convirtiéndose en una parte fundamental de la estrategia de negocio de muchas organizaciones. Sin embargo, con la expansión de este mercado, surge un desafío crucial: comprender y predecir el comportam...

104161 sym Python (1587035 sym/123 pcs) 16 img 1 tbl