Publications by David Dominguez - A01570975
Text Processing Analysis
A Comparative Analysis Between Aladdin Versions Using Text Processing The activity corresponds to comparing two movie scripts, one is from Aladdin from 1992 and the other is from Aladdin from 2019. The first is an animated version, so the task is to analyze how much the new script has been modernized and if it is still remaining faithful to his pre...
21636 sym R (16888 sym/23 pcs) 9 img
Data Explorer
Teoría La librería DataExplorer es la más conocida para el análisis exploratorio. Es muy simple de usar y muy podersoa, pues ofrece como salida un informe con mucha información. La función para crear el informe es create_report, y para ver cada gráfica de forma individual, las funciones son: introduce() plot_intro() plot_boxplot() plot_miss...
736 sym R (1321 sym/15 pcs) 10 img
Wine Cluster Exercise
Contexto Estos datos son el resiltado de una análisis químico de vinos cultivados en la misma región de Italia derivados de tres cultivares diferentes. El análisis determinó las cantidades de 13 componentes que se encuentran en cada uno de los tres tipos de vinos. Paso 1. Instalar paquetes y llamar librerías #install.packages("data.table") l...
731 sym R (5592 sym/20 pcs) 2 img
Text Mining
Text Mining Teoría La minería de texto es el proceso de extraer información util, patrones o conocimientos de texto no estructurados. Consta de 3 etapas: 1. Obtener datos: El reconocimiento óptico de caracteres (OCR) es una tecnología que permite convertir imágenes de texto en texto editable. También es conocido como extracción de texto de...
9880 sym R (6443 sym/19 pcs) 4 img
USArrests
Contexto La base de datos contiene estadísticas en arrestos por cada 100,000 residentes por agresión, asesinato y violación en cada uno de los 50 estados de EE.UU en 1973. Instalar librerías library(maps) # Librería para la visaulización de mapas geograficosw library(cluster) # Librería para la realización de clusters library(ggplot2) # Li...
10615 sym R (4781 sym/14 pcs) 4 img
Clusters Basics
1 Introducción Este documento presenta un análisis de clústeres realizado con R. El objetivo es explorar y agrupar los datos en clústeres basados en similitudes inherentes. 1.1 Preparación del Entorno Es fundamental preparar el entorno de R cargando las librerías necesarias y configurando los parámetros iniciales. # Step 1 Install and call ...
943 sym R (2532 sym/15 pcs) 3 img
CART Decision Trees
Introducción Este documento realiza un análisis del conjunto de datos del Titanic, utilizando el método CART (Classification and Regression Trees) para explorar los factores que influían en la supervivencia de los pasajeros. library(readr) Importación de Datos Los datos se importan desde un archivo CSV localizado en el sistema del usuario. Es...
1246 sym R (4653 sym/16 pcs) 2 img
Regression Walmart
Libraries library(dplyr) ## ## Attaching package: 'dplyr' ## The following objects are masked from 'package:stats': ## ## filter, lag ## The following objects are masked from 'package:base': ## ## intersect, setdiff, setequal, union library(tidyverse) ## ── Attaching core tidyverse packages ──────────────�...
1786 sym R (7244 sym/19 pcs) 1 img
Evidence 2
1 Evidence # 2 Get access to the Tec de Monterrey – Centro Internacional de Casos through mitec.itesm.mx and read the business case “Mexico and Its Attractiveness for Nearshoring”. Please use the required dataset and the business case’s background to prepare a R-Markdown file (PDF or html) that address the following instructions: 1.1 Loadi...
21061 sym R (34899 sym/68 pcs) 14 img
Examen III and IV
1 Exam Part III Please download the dataset entertainment_stocks.csv (Canvas). Your task is to perform a time series analysis for a stock price. Please select a stock price and complete the following tasks: 1.0.1 Import Data library(readr) entre <- read_csv("entre.csv") head(entre) ## # A tibble: 6 × 7 ## Date Disney_Adj_Close Netflix_Adj...
14906 sym R (20732 sym/87 pcs) 23 img