Publications by Valerio Ferdinando Calà
Bias-variance decomposition
1. Forecast Error \[Y_i = f(x_i)+ \varepsilon_i, \quad i=1,\ldots,n\] Il setting è detto Fixed-X quando sia nel training che nel test set i predictors sono trattati come non-stocastici, i.e. le realizzazioni di \(X\) sono uguali in entrambi gli insiemi di dati. Abbiamo quindi un campione \((x_1,y_1),\ldots,(x_n,y_n)\) iid per il training set e...
6001 sym R (1571 sym/7 pcs) 3 img
Stat 101
Statistics & Probability In questo documento markdown vengono svolti esercizi base di Statistica e Calcolo delle Probabilità. Programma del documento: Distribuzioni di frequenza, indici di posizione, variabilità, forma e concentrazione Distribuzioni di frequenza multiple per caratteri qualitativi (indici di connessione) Distribuzioni di freq...
2525 sym R (14135 sym/39 pcs) 5 img
Ridge regression
OLS variance Se \(n \gg p\) allora lo stimatore OLS tenderà ad avere una varianza più bassa, cioé mi aspetto stime simili per i coefficienti delle variabili esplicative pur stimando il modello con dati diversi; se \(n \approx p\) allora lo stimatore OLS tenderà ad andare in overfitting e restituire stime non affidabili una volta cambiato l�...
6503 sym R (3200 sym/9 pcs) 2 img
Prova d'Esame - Statistica Computazionale
1.Date U1,U2 … iid U(0,1), si descriva il metodo dell’inversione della funzione di ripartizione per generare delle determinazioni casuali da una variabile casuale (v.c.) Y continua con f(y) = 3y2 per 0<y<1 cdf <- function(y) {y^3} inverse.F <- function(u) {u^(1/3)} R <- 1000 # campiono R valori da U=F(Y) ~ U(0,1) u <- runif(R) # calcolo...
1293 sym R (1760 sym/8 pcs)
Bootstrap and Jacknife
BOOTSTRAP Si tratta di una tecnica introdotta a fine anni ’70 con cui calcolare il valore atteso, varianza o altre proprietà (PARAMETRO THETA) di uno stimatore o di una procedura statistica, quando la risoluzione analitica non è agevole. L’idea generale è quella di fare inferenza con simulazioni in ambito frequentista (RICAMPIONAMENTO dal...
3052 sym R (6490 sym/32 pcs) 2 img
Sampling Theory
Campionamento In statistica inferenziale siamo interessati a dare delle stime di quantità ignote; tali stime possono essere puntuali (singolo valore) oppure intervallari. In quest’ultimo caso, oltre agli estremi dell’intervallo in cui cade la stima, il ricercatore fissa a-priori la probabilità che il vero valore del parametro cada nell’in...
4059 sym R (4095 sym/28 pcs) 2 img
Econometrics - Part 1
Introduzione all’Econometria L’econometria è la scienza che si occupa di studiare relazioni economiche in modo quantitativo. L’enfasi può essere più sull’analisi e sviluppo di metodi econometrici, oppure più sulla loro applicazione: in quest’ultimo caso parliamo di econometria applicata. Questa richiede un bagaglio di conoscenze sta...
11515 sym R (2290 sym/12 pcs)
Statistical Learning on Pokémon
Statistical Learning on Pokémon: Gotta Catch’em (almost) All! Valerio Ferdinando Calà 01 Settembre 2019 Introduzione al mondo dei Pokémon Per chi non conoscesse il tema, Pokémon è un media franchise giapponese di proprietà della “The Pokémon Company”, creato nel 1996 dall’informatico Satoshi Tajiri. Nascono come serie di videogioc...
6454 sym 10 img
Nintendo sales analysis
Analisi esplorativa dei dati X = serie storica annuale delle unità (in milioni) di console domestiche Nintendo vendute Dall’analisi grafica dei dati grezzi, possiamo vedere come le unità vendute hanno seguito un andamento altalenante negli anni: nel 1998 c’erano più di 10 milioni di unità vendute, ma questo numero è diminuito per tutto...
6985 sym 11 img
Stephen Curry NBA Statistics
Analisi esplorativa dei dati Ringrazio la fonte dei dati: https://www.basketball-reference.com/players/c/curryst01.html Stephen Curry nel 2009 In questa prima sezione carico i diversi file .csv esportati dal sito sopracitato, uno per ciascuna regular season, tutti relativi allo stesso giocatore NBA (Stephen Curry). Le domande a cui voglio cerca...
2788 sym R (2893 sym/17 pcs) 9 img