Publications by Rafael
Qual o melhor estado para se comprar carros que ainda estejam dentro da garantia de fábrica e por quê?nt
Carregando pacotes e dataset pacotes <- c("readxl", "dplyr", "PerformanceAnalytics" ) lapply(pacotes, library, character.only = TRUE) cars_train <- read_excel("cars_train.xlsx") Análises Usando table para olhar as frequências da variável “garantia_de_fábrica”: table(cars_train$garantia_de_fábrica) ## ## Garantia de fábrica ## ...
1729 sym Python (5256 sym/13 pcs)
Qual o melhor estado cadastrado na base de dados para se vender um carro de marca popular e por quê?
Carregando pacotes e dataset pacotes <- c("readxl", "dplyr", "PerformanceAnalytics" ) lapply(pacotes, library, character.only = TRUE) cars_train <- read_excel("cars_train.xlsx") Análises Usando table para olhar as marcas disponíveis: table(cars_train$marca) ## ## ALFA ROMEO AUDI BMW BRM CHERY ## ...
1179 sym Python (3049 sym/9 pcs)
XGBoost
XGBoosting is a machine learning technique based on decision trees that uses a boosting algorithm to enhance predictive performance. It combines multiple weak decision trees into a stronger model, making it one of the most popular approaches for classification and regression problems. Let’s do a classification exercise using information recor...
2230 sym 3 img
Exercício Árvore de Regressão
O conjunto de dados “tips” é um exemplo comumente usado em tutoriais e documentação para ilustrar técnicas de visualização de dados e análise exploratória. Ele apresenta informações a respeito das mesas de um bar ou restaurante. Vamos fazer um exercício onde tentaremos prever o valor das gorjetas (tips) dadas pelas mesas através...
2649 sym 6 img
Floresta Aleatória de Regressão
O banco de dados “BostonHousing” possui centenas de observações acerca de casas na cidade de Boston. Dentre as variáveis temos o valor mediano das casas e variáveis sobre a região da casa, e sobre a casa em si. Vamos usar um modelo de floresta aleatória para tentarmos estimar o valor de cada casa através das outras variáveis. Insta...
3319 sym 1 img
Árvore de Classificação
As árvores de classificação são modelos usados para realizar estimativas em problemas estatísticos nos quais a variável de saída é categórica. Neste projeto, iremos realizar um exercício utilizando um banco de dados simulado para estimar se os clientes de uma instituição financeira possuem algum potencial de inadimplência ou não. ...
3778 sym R (11131 sym/35 pcs) 7 img
Análise de correpondência - Doenças cardíacas
No mundo contemporâneo, em que doenças cardiovasculares têm se tornado uma preocupação global, a capacidade de identificar os fatores que contribuem para o desenvolvimento de problemas cardíacos é fundamental. Compreender os aspectos e as características pessoais que desempenham um papel crucial nessa condição nos permite desenvolver ...
6705 sym 2 img 10 tbl
Análise Fatorial - Rank RM
A análise fatorial por componentes principais é uma técnica estatística poderosa que nos permite reduzir a complexidade de um conjunto de dados, identificando padrões subjacentes e resumindo a informação em fatores latentes. Assim, o objetivo principal da análise fatorial por componentes principais é identificar e descrever os constru...
11774 sym Python (13636 sym/37 pcs) 3 img 7 tbl
Clusterização para Segmentação de Clientes
A clusterização, também conhecida como análise de agrupamento, é uma técnica de aprendizado não supervisionado utilizada para identificar padrões e estruturas em conjuntos de dados. O objetivo principal da clusterização é agrupar objetos similares em clusters e objetos diferentes em clusters distintos, de acordo com alguma medida de ...
12187 sym 4 img 2 tbl
Criando e comparando modelos para estimar o volume de vendas no varejo
O objetivo deste trabalho é prever as futuras alterações no indice do volume de vendas no varejo do estado de Minas Gerais. Vamos utilizar o indice do IBGE como série temporal, e estimaremos um modelo ARIMA com ajuste de volatilidade condicional(GARCH) nas previsões e um modelo ETS. No final iremos comparar e analisar as previsões de ambo...
11309 sym Python (8248 sym/58 pcs) 8 img