Publications by DataIntelligence
gene_ttcc_casen_corregidas
2006 casen_2006 <- readRDS(file = "casen_2006_c.rds") ab <- casen_2006 a <- ab$codigo b <- ab$COMUNA c <- ab$CORTE d <- ab$T4 e <- ab$SEXO cross_tab = xtabs(ab$EXPC ~ unlist(a) + unlist(b) + unlist(c) + unlist(d) + unlist(e),aggregate(ab$EXPC ~ unlist(a) + unlist(b) + unlist(c) + unlist(d) + unlist(e) ,ab,mean)) tabla <- as.data.fr...
66 sym R (6669 sym/18 pcs)
correccion_final_casen_I
Reparación 2006 Acá debemos reparar Primavera y homologar los códigos al 2020. ir al documento de códigos actualizados 1 Leemos la base de datos original: 2 Visibilizamos sus etiquetas: 3 Corroboramos el error para Primavera: Primavera <- subset(casen_2006_labeled, COMUNA == "Primavera") head(Primavera$EXPC,5) ## [1] 0.24 0.24 0.24 0.24 0.2...
794 sym R (5416 sym/26 pcs)
gene_promedios_ttcc_casen_corregidas
2006 casen_2006 <- readRDS(file = "casen_2006_c.rds") ab <- casen_2006 a <- ab$YAUTHAJ b <- ab$COMUNA c<- ab$codigo d<- ab$E1 e <- ab$T4 f <- ab$SEXO promedios_grupales <-aggregate(a, by=list(b, c, d, e, f), FUN = mean , na.rm = TRUE) promedios_grupales$anio <- "2006" names(promedios_grupales)[1] <- "Comuna" names(promedios_g...
66 sym R (8382 sym/18 pcs)
casen2
Reparación 2013 casen_2013 <- read_sav("Casen2013.sav") casen_2013_labeled <- as_factor(casen_2013, only_labelled = TRUE) data_code <- stack(attr(casen_2013$comuna, 'labels')) data_code <- data_code[c(2,1)] names(data_code)[1] <- "comuna" names(data_code)[2] <- "codigo" #data_code data_code[171,2]<-16101 data_code[172,2]<-16102 ...
352 sym R (3377 sym/20 pcs)
definición_variables_ingresos
2013-2015-2017 1 PERSONAS Siempre se consideran a las personas a menos que se mencione explícitamente a los hogares. 1.1 yautcor: Ingresos autónomos. Corresponden a la suma de todos los pagos que reciben las personas, provenientes tanto del trabajo como de la propiedad de los activos. 1.1.1 sueldos y salarios, monetarios y en especies (pregun...
5103 sym
variables_casen_001
Índice 1. Introdución. 2. Glosario. 3. Algunos conceptos sobre el Ingreso. 4. Las tablas Introducción. Deseamos comprender la distribución del ingreso del 2006 al 2017 para las comunas de Chile mediada por variables sociales. Queremos un análisis más detallado. Para ello, ampliamos el abanico de ingresos considerando todas las variables as...
6094 sym 2 img 1 tbl
promedios_sin_outliers
Teoría Los valores notablemente diferentes de la mayoría en un conjunto de datos se conocen como atípicos u outliers. Son anomalías que ocurren debido a errores de medición, no siempre siendo el resultado de observaciones mal registradas, sino que también producto de fluctuaciones naturales. Pueden también ser sólo simplemente hallazgos i...
7855 sym R (1220 sym/7 pcs) 2 img 2 tbl
casen_unificado
Aplicación Shiny-Casen: Aplicación shiny Índice: 1 Machine Learning: Clasificacion Se exponen una serie de algoritmos de ML para ser aplicados a la Casen. Son de particular interés los métodos de Bosques aleatorios, Máquinas de soporte vectorial y Redes neuronales. 2 Análisis de los ingresos Se revisan algunos conceptos sobre el ingreso, ...
2444 sym 1 img
casen007
Introducción Necesitamos que nuestras estimaciones de pobreza obtenidas con cálculos propios desde la Casen coincidan con la información ya publicada. Hicimos 6 contrastes, en algunos acertamos y en otros no. Para el primero, en el que consideramos la pobreza en Iquique para el 2006, nuestras estimaciones coinciden perfectamente. Éste resulta...
4555 sym R (5967 sym/85 pcs) 7 img
casen008
Una vez resuelto el requerimiento técnico de generalizar Tablas de Contigencia (TTCC), seguimos con la necesidad de plantear preguntas generadoras de TTCC con sentido e interés. Haremos ejercicios sobre un subset de la tabla Casen 2017 que toma todos los registros de las comunas de Iquique, Alto Hospicio, Pozo Almonte, Huara y Pica. Como ejempl...
3708 sym R (1128 sym/2 pcs) 10 tbl