Publications by CasualStatistician

R Squared

10.09.2023

Applying an ML Algorithm is Not Enough! Previously on… In the previous post, we discussed the Mean Absolute Deviation and how it can be a useful tool for evaluating the performance of a machine learning model when the data is affected by extreme values. Another very interesting measure is the R-squared (\(R^2\)), which, unlike the Mean Squared Er...

2110 sym 1 img

Mean Sqaured Error

08.09.2023

Applying an ML Algorithm is Not Enough! In the context of statistical or machine learning models, the use of metrics is essential to evaluate the performance of our estimates. Let’s explore the main features of the Mean Square Error (MSE). \[ MSE=\frac{1}{n}\sum_{i=1}^n (y_i-\hat{f}(x_i))^2, \] where \(y_i\) represents the observed value of the d...

2095 sym 1 img

Ridge vs OLS, details about tuning parameter

18.06.2023

Un modo per ridurre la varianza di \(\hat{\boldsymbol{\beta}}^{\mathrm{OLS}}\) (ovvero i parametri ottenuti tramite il metodo dei minimi quadrati) è quello forzare alcuni dei coefficienti stimati verso lo zero. La regressione Ridge (Hoerl e Kennard, 1970) risolve il seguente problema di ottimizzazione: \[ \left(\hat{\mu}_{\lambda}^{\mathrm{R}}, \h...

7415 sym

Ridge e SVD, Esploriamo il legame

18.06.2023

La decomposizione ai valori singolari (SVD) è una generalizzazione della decomposizione basata sugli autovalori di una matrice quadrata ( quadrata significa che il numero di righe è uguale al numero di colonne). La SVD consente di generalizzare questa idea e fattorizzare qualsiasi \(X \in \mathbb{R}^{n \times p}\). Ovvero anche in contesti in cui...

3976 sym

test di ipotesi parametrici e non parametrici

31.05.2023

#install.packages('Rcmdr', dependencies=TRUE) #install.packages('Biodem',dependencies=TRUE ) #library(Rcmdr) #library(Biodem) library(MASS) T- Test BodyTemperature<- read.table('BodyTemperature.txt', sep=' ', header=TRUE) Il dataset BodyTemperature è composto da: Gender: Genere di appartenenza (Maschio e Femmina); Age: Et...

15751 sym R (19170 sym/129 pcs) 17 img

Ridge vs Lasso: Overview of the main differences in R (ENG)

30.04.2023

library(tidyr) library(dplyr) library(broom) library(MASS) data(meatspec, package="faraway") Ridge Regression In contexts where information is redundant, even established and simple methods such as ordinary linear regression (OLS) are not effective. Let’s try to understand why. For ordinary linear regression, there is a closed formula that preci...

8735 sym R (1814 sym/15 pcs) 4 img

Ridge vs Lasso: Overview of the main differences in R

29.04.2023

library(tidyr) library(dplyr) library(broom) library(MASS) data(meatspec, package="faraway") Ridge Regression In contesti in cui l’informazione è ridondante, anche i metodi consolidati e semplici come la regressione lineare ordinaria (OLS) non sono efficaci. Cerchiamo di capire perché. Per la regressione lineare ordinaria, esiste una formula c...

9008 sym R (1755 sym/15 pcs) 4 img