Publications by sandropenha

stats_medidas_e_frequencias

21.12.2022

Estatística - medidas e frequencias O presente notebook, objetiva a utilização das linguagens R e Python (concomitantemente) de forma a realizar análises estatisticas e comparar a utilizaçao de ambas as linguagens. dados utilizados: PNAD 2015. Sobre os variáveis: RENDA: Rendimento mensal do trabalho principal para pessoas de 10 anos ou ...

5628 sym R (28311 sym/183 pcs) 20 img 3 tbl

Previsão de ocorrência de câncer de mama

12.06.2020

Definição do problema: Previsão de occorências de cancer de mama utilizando o dataset do UCI: http://archive.ics.uci.edu/ml/datasets/Breast+Cancer+Wisconsin+%28Diagnostic%29 Dicionário de dados: ID number Diagnosis (M = malignant, B = benign) 3-32) Ten real-valued features are computed for each cell nucleus: radius (mean of distances fr...

1778 sym R (13105 sym/32 pcs)

Análise de sentimentos no Twitter - Rick and Morty

14.06.2020

Análise de Sentimentos em Redes Sociais: Neste trabalho, faremos uma análise de sentimentos no twitter sobre a Série “Rick and Morty”, utilizando uma massa de dados de 10.000 tweets. Analisaremos os dados segundo o modelo “Naive Bayes” para criação dos dados de polarização e de emoções. Também criaremos aqui uma Wordcloud e um d...

2805 sym R (12186 sym/25 pcs) 4 img

Prevendo demanda de estoque - Bimbo

23.08.2020

PROBLEMA DE NEGÓCIO Prevendo demanda de estoque com base em vendas: O Grupo Bimbo (https:\\www.grupobimbo.com), se esforça para atender a demanda diária dos consumidores por produtos frescos de panificação nas prateleiras de mais de 1 milhão de lojas ao longo das suas 45.000 lojas em todo o México. Atualmente, os cálculos diários de esto...

6679 sym R (34576 sym/99 pcs) 10 img

Prevendo despesas médicas

08.07.2020

Problema de negócio: Analise amostral de despesas médicas de 2018 para um conjunto de pacientes espalhados nas regiões Sudeste, Sul, Nordeste e Norte do Brasil. Criacao de um modelo preditivo para a variável de despesas médicas para cada cluster do dataset. O dataset possui o total de 1.338 observaçoes e 7 variáveis. Perguntas de negócio...

7000 sym R (14325 sym/79 pcs) 10 img

Previsão de taxa média de ocupação - Boston

04.08.2020

DEFINIÇÃO DO PROBLEMA DE NEGÓCIO: Nosso objetivo é construir um modelo de Machine Learning que seja capaz de fazer previsões sobre a taxa média de ocupação de casas na região de Boston, EUA, por proprietários. A variável a ser prevista é um valor numérico que representa a mediana da taxa de ocupação das casas em Boston. Para cada c...

6985 sym R (13273 sym/48 pcs) 12 img

Analise estatistica - diamonds

06.09.2020

knitr::opts_chunk$set(echo = TRUE, warning = FALSE) Sobre: Análise estatística do dataset “diamonds” disponibilizado pela biblioteca do ggplot2, uma das mais importantes bibliotecas para visualização de dados quando falamos em data science. Dentre os objetivos deste projeto, estão a prática de técnicas de análise exploratória e mode...

13495 sym R (6328 sym/38 pcs) 16 img

Regressao Linear Simples - Prevendo o Peso do bebê

28.07.2020

PROBLEMA DE NEGOCIO: Previsao no peso do bebe de acordo com sua idade em meses Modelo: Regressao linear simples LIBRARYS: library(tidyverse) ## ── Attaching packages ──────────────────────────────────────────────────────────�...

2505 sym R (1770 sym/18 pcs) 3 img

Detecção de Fraudes no Tráfego de Cliques em Propagandas de Aplicações Mobile

14.08.2020

INTRODUÇÃO: O risco de fraude está em toda parte, mas para as empresas que anunciam online, a fraude de cliques pode acontecer em um volume avassalador, resultando em dados de cliques enganosos e dinheiro desperdiçado. Os canais de anúncios podem aumentar os custos simplesmente quando pessoas ou bots clicam nos anúncios em grande escala, o ...

6007 sym R (11777 sym/45 pcs) 5 img

Analise estatistica

05.09.2020

Sobre: Análise estatística e exploratória do dataset “diamonds” disponibilizado pela biblioteca do ggplot2, uma das mais importantes bibliotecas para visualização de dados quando falamos em data science. Dentre os objetivos deste projeto, estão a prática de técnicas de análise exploratória e modelagem estatística para obtenção de...

12901 sym R (534 sym/3 pcs) 16 img