Publications by CasualStatistician
R Squared
Applying an ML Algorithm is Not Enough! Previously on… In the previous post, we discussed the Mean Absolute Deviation and how it can be a useful tool for evaluating the performance of a machine learning model when the data is affected by extreme values. Another very interesting measure is the R-squared (\(R^2\)), which, unlike the Mean Squared Er...
2110 sym 1 img
Mean Sqaured Error
Applying an ML Algorithm is Not Enough! In the context of statistical or machine learning models, the use of metrics is essential to evaluate the performance of our estimates. Let’s explore the main features of the Mean Square Error (MSE). \[ MSE=\frac{1}{n}\sum_{i=1}^n (y_i-\hat{f}(x_i))^2, \] where \(y_i\) represents the observed value of the d...
2095 sym 1 img
Ridge vs OLS, details about tuning parameter
Un modo per ridurre la varianza di \(\hat{\boldsymbol{\beta}}^{\mathrm{OLS}}\) (ovvero i parametri ottenuti tramite il metodo dei minimi quadrati) è quello forzare alcuni dei coefficienti stimati verso lo zero. La regressione Ridge (Hoerl e Kennard, 1970) risolve il seguente problema di ottimizzazione: \[ \left(\hat{\mu}_{\lambda}^{\mathrm{R}}, \h...
7415 sym
Ridge e SVD, Esploriamo il legame
La decomposizione ai valori singolari (SVD) è una generalizzazione della decomposizione basata sugli autovalori di una matrice quadrata ( quadrata significa che il numero di righe è uguale al numero di colonne). La SVD consente di generalizzare questa idea e fattorizzare qualsiasi \(X \in \mathbb{R}^{n \times p}\). Ovvero anche in contesti in cui...
3976 sym
test di ipotesi parametrici e non parametrici
#install.packages('Rcmdr', dependencies=TRUE) #install.packages('Biodem',dependencies=TRUE ) #library(Rcmdr) #library(Biodem) library(MASS) T- Test BodyTemperature<- read.table('BodyTemperature.txt', sep=' ', header=TRUE) Il dataset BodyTemperature è composto da: Gender: Genere di appartenenza (Maschio e Femmina); Age: Et...
15751 sym R (19170 sym/129 pcs) 17 img
Ridge vs Lasso: Overview of the main differences in R (ENG)
library(tidyr) library(dplyr) library(broom) library(MASS) data(meatspec, package="faraway") Ridge Regression In contexts where information is redundant, even established and simple methods such as ordinary linear regression (OLS) are not effective. Let’s try to understand why. For ordinary linear regression, there is a closed formula that preci...
8735 sym R (1814 sym/15 pcs) 4 img
Ridge vs Lasso: Overview of the main differences in R
library(tidyr) library(dplyr) library(broom) library(MASS) data(meatspec, package="faraway") Ridge Regression In contesti in cui l’informazione è ridondante, anche i metodi consolidati e semplici come la regressione lineare ordinaria (OLS) non sono efficaci. Cerchiamo di capire perché. Per la regressione lineare ordinaria, esiste una formula c...
9008 sym R (1755 sym/15 pcs) 4 img