Publications by 東京国際大学 データサイエンス教育研究所 竹田 恒
分類(ロジスティック回帰モデル)
どのぐらい受験勉強したら大学に合格するか, 1日の平均勉強時間ごとの合格確率を知りたい。 データ 1日の平均勉強時間[hour]とある大学の合否(1:合格,0:不合格) の仮想的データ d <- read.csv(file = "univ_exam_data.csv") library(kableExtra) knitr::kable(d, caption = ...
429 sym R (1660 sym/8 pcs) 1 img 1 tbl
分類(ロジスティック回帰モデル)演習
次のデータを用いて新車購入の確率を予測する。 データ User.ID:お客様番号 Gender:性別(Male:男性,Female:女性) Age: 年齢 AnnualSalary:年収(US$) Purchased:新車購入の有無(1:購入,0:未購入) options(digits = 2) d <- na.omit(read.csv(file = "car_data.csv")) (n <- nrow(d)) ## [...
636 sym R (9386 sym/26 pcs) 1 img
時系列分析(移動平均)
移動平均 次のロボット販売のデータを使って,移動平均を求めトレンドを分析する。 データ rm(list = ls()) options(digits = 2) year <- 2011:2017 sales <- c(1, 3, 2, 7, 3, 8, 7) n <- length(year) d <- data.frame(year, sales) library(kableExtra) knitr::kable(d,caption = 'ロボット販売 ', col.na...
964 sym R (3861 sym/23 pcs) 6 img 3 tbl
時系列分析(ラグ系列)
rm(list = ls()) library(quantmod) library(kableExtra) ラグ(時間遅れ) ある時点を基準にしたときの時間の遅れ(ズレ)を ラグ(lag, time lag)という。 時系列データにおいて,時点\(t\)の値を\(y_t\)としたとき, 時点\(t\)を基準にして1時点前の値は\(y_{t-1}\)で表される。 \(k\)�...
270 sym R (846 sym/4 pcs) 1 img 1 tbl
時系列分析(定常・非定常)
定常・非定常 時間によらず期待値,自己共分散が一定であるような 時系列データの性質を定常性(ていじょうせい;stationality)という。 定常性を持つ時系列を定常時系列という。 そうでないものを非定常時系列という。 定常時系列の例 定常時系列は期待�...
453 sym 2 img
時系列分析(局所回帰)
局所回帰(local regression) LOESS(locally estimated scattered smoothing) 代表的な局所回帰であるLOESS(ろえす)について説明する。 平滑化窓幅 \(平滑化窓幅 = \frac{近傍点数k}{標本サイズn}\)が設定すべきパラメータである。 平滑化窓幅(span)を決めると標本サイズ\(n\...
1635 sym R (4260 sym/10 pcs) 3 img 1 tbl