Publications by DataIntelligence

acp sobre puntos de calor

14.10.2020

ACP El análisis de componentes principales nos permite resumir y visualizar información en un conjunto de datos que contiene individuos/observaciones descritas por múltiples variables cuantitativas intercorrelacionadas. Cada variable podría considerarse como una dimensión diferente. Si tiene más de 3 variables en sus conjuntos de datos, pod...

6302 sym R (8838 sym/33 pcs) 11 img

R_a_e

18.10.2020

ACP El análisis de componentes principales nos permite resumir y visualizar información en un conjunto de datos que contiene individuos/observaciones descritas por múltiples variables cuantitativas intercorrelacionadas. Cada variable podría considerarse como una dimensión diferente. Si tiene más de 3 variables en sus conjuntos de datos, pod...

6394 sym R (13793 sym/44 pcs) 11 img

rf001

02.12.2020

Random forest para extraer las variables mas importantes dentro de un conjunto de datos. library("readxl") library(randomForest) ## Warning: package 'randomForest' was built under R version 4.0.3 ## randomForest 4.6-14 ## Type rfNews() to see new features/changes/bug fixes. library(reshape) ## Warning: package 'reshape' was built under R version...

98 sym R (5996 sym/16 pcs) 2 img

ttgg_socio

12.11.2020

Se plantean una serie de preguntas de interés social para determinar la mejor forma de presentar la información con tablas de contingencia. Se toman como ejemplos la discriminación y la precariedad laboral. Discriminación La discriminación es una práctica cotidiana que consiste en dar un trato desfavorable o de desprecio inmerecido a dete...

12399 sym

ttcc2

11.11.2020

Una vez resuelto el requerimiento técnico de generalizar Tablas de Contigencia (TTCC), seguimos con la necesidad de plantear preguntas generadoras de TTCC con sentido e interés. Haremos ejercicios sobre un subset de la tabla Casen 2017 que toma todos los registros de las comunas de Iquique, Alto Hospicio, Pozo Almonte, Huara y Pica. Como ejempl...

31768 sym R (1116 sym/1 pcs)

ttgg

11.11.2020

Sexo versus estado civil  dataset$“Estado civil”   Anulado(a)   Casado(a)   Conviviente civil (con acuerdo de unión civil)   Conviviente o pareja sin acuerdo de unión civil   Divorciado (a)   Separado(a)   Soltero(a)   Viudo(a)   dataset$Sexo     Hombre  3 1190 13 861 32 130 2656 ...

27672 sym R (1116 sym/1 pcs)

Tablas de contingencia generalizadas

09.11.2020

Los datos Cantidades totales y porcentajes de pobres y no pobres: ## ## No pobre Pobre ## 744 182 ## ## No pobre Pobre ## 0.8034557 0.1965443 Tabla de contingencia entre pobreza y sexo: ## ## Hombre Mujer ## No pobre 365 379 ## Pobre 73 109 Valores marginales de la tabla de c...

3295 sym R (3562 sym/13 pcs)

promedios_casen2006

10.11.2020

Promedios La Casen considera hogares a las unidades sociales que, dentro de una vivienda comparten el presupuesto y el lugar de consumo de una alimentación diaria. Los hogares vienen entonces caracterizados por un numero identificatorio al que pertenece cada una de las personas entrevistadas. En un caso extremo, un hogar lo puede constituir un �...

1926 sym

reque_casen

26.11.2020

suppressWarnings(library(RODBC)) library(ggplot2) library(ggpubr) library(markdown) library(shiny) library(shinythemes) library(tidyverse) library(magrittr) library(lubridate) library(plotly) library(xts) library(dygraphs) library(kableExtra) library(knitr) library("readxl") library(rsconnect) library(dplyr) library(summarytools...

5 sym R (11252 sym/17 pcs)

Document

09.01.2021

Índice 1. La matriz de confusión. 2. Análisis de componentes principales 3. Diagramas ROC 4. Los árboles de clasificación. 5. Bosques aleatorios. 6. Máquinas de soporte vectorial 7. Clasificador bayesiano ingenuo (Bayes Naive) 8. K Nearest Neighbors 9. Redes neuronales para clasificar 10. Análisis del discriminante lineal 11. La regresión...

9223 sym R (18226 sym/61 pcs) 14 img 10 tbl