Publications by sandropenha
stats_medidas_e_frequencias
Estatística - medidas e frequencias O presente notebook, objetiva a utilização das linguagens R e Python (concomitantemente) de forma a realizar análises estatisticas e comparar a utilizaçao de ambas as linguagens. dados utilizados: PNAD 2015. Sobre os variáveis: RENDA: Rendimento mensal do trabalho principal para pessoas de 10 anos ou ...
5628 sym R (28311 sym/183 pcs) 20 img 3 tbl
Previsão de ocorrência de câncer de mama
Definição do problema: Previsão de occorências de cancer de mama utilizando o dataset do UCI: http://archive.ics.uci.edu/ml/datasets/Breast+Cancer+Wisconsin+%28Diagnostic%29 Dicionário de dados: ID number Diagnosis (M = malignant, B = benign) 3-32) Ten real-valued features are computed for each cell nucleus: radius (mean of distances fr...
1778 sym R (13105 sym/32 pcs)
Análise de sentimentos no Twitter - Rick and Morty
Análise de Sentimentos em Redes Sociais: Neste trabalho, faremos uma análise de sentimentos no twitter sobre a Série “Rick and Morty”, utilizando uma massa de dados de 10.000 tweets. Analisaremos os dados segundo o modelo “Naive Bayes” para criação dos dados de polarização e de emoções. Também criaremos aqui uma Wordcloud e um d...
2805 sym R (12186 sym/25 pcs) 4 img
Prevendo demanda de estoque - Bimbo
PROBLEMA DE NEGÓCIO Prevendo demanda de estoque com base em vendas: O Grupo Bimbo (https:\\www.grupobimbo.com), se esforça para atender a demanda diária dos consumidores por produtos frescos de panificação nas prateleiras de mais de 1 milhão de lojas ao longo das suas 45.000 lojas em todo o México. Atualmente, os cálculos diários de esto...
6679 sym R (34576 sym/99 pcs) 10 img
Prevendo despesas médicas
Problema de negócio: Analise amostral de despesas médicas de 2018 para um conjunto de pacientes espalhados nas regiões Sudeste, Sul, Nordeste e Norte do Brasil. Criacao de um modelo preditivo para a variável de despesas médicas para cada cluster do dataset. O dataset possui o total de 1.338 observaçoes e 7 variáveis. Perguntas de negócio...
7000 sym R (14325 sym/79 pcs) 10 img
Previsão de taxa média de ocupação - Boston
DEFINIÇÃO DO PROBLEMA DE NEGÓCIO: Nosso objetivo é construir um modelo de Machine Learning que seja capaz de fazer previsões sobre a taxa média de ocupação de casas na região de Boston, EUA, por proprietários. A variável a ser prevista é um valor numérico que representa a mediana da taxa de ocupação das casas em Boston. Para cada c...
6985 sym R (13273 sym/48 pcs) 12 img
Analise estatistica - diamonds
knitr::opts_chunk$set(echo = TRUE, warning = FALSE) Sobre: Análise estatística do dataset “diamonds” disponibilizado pela biblioteca do ggplot2, uma das mais importantes bibliotecas para visualização de dados quando falamos em data science. Dentre os objetivos deste projeto, estão a prática de técnicas de análise exploratória e mode...
13495 sym R (6328 sym/38 pcs) 16 img
Regressao Linear Simples - Prevendo o Peso do bebê
PROBLEMA DE NEGOCIO: Previsao no peso do bebe de acordo com sua idade em meses Modelo: Regressao linear simples LIBRARYS: library(tidyverse) ## ── Attaching packages ──────────────────────────────────────────────────────────�...
2505 sym R (1770 sym/18 pcs) 3 img
Detecção de Fraudes no Tráfego de Cliques em Propagandas de Aplicações Mobile
INTRODUÇÃO: O risco de fraude está em toda parte, mas para as empresas que anunciam online, a fraude de cliques pode acontecer em um volume avassalador, resultando em dados de cliques enganosos e dinheiro desperdiçado. Os canais de anúncios podem aumentar os custos simplesmente quando pessoas ou bots clicam nos anúncios em grande escala, o ...
6007 sym R (11777 sym/45 pcs) 5 img
Analise estatistica
Sobre: Análise estatística e exploratória do dataset “diamonds” disponibilizado pela biblioteca do ggplot2, uma das mais importantes bibliotecas para visualização de dados quando falamos em data science. Dentre os objetivos deste projeto, estão a prática de técnicas de análise exploratória e modelagem estatística para obtenção de...
12901 sym R (534 sym/3 pcs) 16 img