Publications by 東京国際大学 データサイエンス教育研究所 竹田 恒
エンコーディング(encoding)
1 One-Hot Encoding char <- c('あ', 'い', 'う', 'え', 'お') d0 <- data.frame(y = 1, aiueo = rep(char, 3)) x <- model.matrix(y ~ aiueo - 1, data = d0) colnames(x) <- char d <- cbind(d0$aiueo, x) library(kableExtra) kable(d, caption = 'One-Hot Encoding')%>%kable_paper('striped', full_width = F)%>% add_header_above(c('前' = 1, '後' = 5)) On...
50 sym R (504 sym/2 pcs) 2 tbl
One-Hot Encoding
char <- c('あ', 'い', 'う', 'え', 'お') d0 <- data.frame(y = 1, aiueo = rep(char, 3)) x <- model.matrix(y ~ aiueo - 1, data = d0) colnames(x) <- char d <- cbind(d0$aiueo, x) head(d) ## あ い う え お ## 1 "あ" "1" "0" "0" "0" "0" ## 2 "い" "0" "1" "0" "0" "0" ## 3 "う" "0" "0" "1" "0" "0" ## 4 "え" "0" "0" "0" "1" "0" ## ...
9 sym R (573 sym/4 pcs) 2 tbl
深層学習(分類)
1 データ d <- dataset_fashion_mnist() str(d) ## List of 2 ## $ train:List of 2 ## ..$ x: int [1:60000, 1:28, 1:28] 0 0 0 0 0 0 0 0 0 0 ... ## ..$ y: int [1:60000(1d)] 9 0 0 3 0 2 7 2 5 5 ... ## $ test :List of 2 ## ..$ x: int [1:10000, 1:28, 1:28] 0 0 0 0 0 0 0 0 0 0 ... ## ..$ y: int [1:10000(1d)] 9 2 1 1 6 1 4 6 5 7 ... # クラス�...
211 sym R (5872 sym/17 pcs) 4 img
深層学習(回帰)
1 データ d <- read.csv('https://stats.dip.jp/01_ds/data/load_amedas_y2017-2022_tokyo.csv') d$px <- as.POSIXct(d$datetime) d$gw <- d$mw / 1000 # 測定値 (単位変換:MW -> GW) d$gwhat <- NA # 予測値格納用 #d$gw.wkago <- c(rep(NA, 168), d$gw)[1:nrow(d)] # 追加説明変数(weekly AR) #d <- d[169:nrow(d), ] (n <- nrow(d)) ## [1] 5...
331 sym R (7135 sym/18 pcs) 26 img 2 tbl
回帰分析(予測)
車の燃費データを使って回帰分析する。 1 データ 単位はオリジナル(出典参照)から馴染みのあるものに変換した。 出典:【UCI Machine Learning Repository】Auto MPG Data Set 説明変数 内容(単位) km 燃費(km/L) ncy 気筒数(本) cc 排気量(cc) hp 馬力(hp) kg 車�...
430 sym R (2155 sym/10 pcs) 1 img 5 tbl
回帰分析(交互作用項)
1 データ n <- 100 x1 <- 1:n x2 <- sqrt(x1) y <- 0.5 * x1 + 1.0 * x2 + 0.1 * x1 * x2 + rnorm(n) d <- data.frame(y, x1, x2) 2 フィッティング Rのlm関数のモデル式で\(説明変数1\times 説明変数2\)と記入すると, 説明変数1,説明変数2,説明変数1と説明変数2の交互作用項の3変数に展開される�...
208 sym R (1130 sym/10 pcs) 1 tbl
回帰分析(重回帰)
1 データ 約500の町の心臓病患者の人口割合(%)と喫煙割合(%),自転車通勤割合(%)について調べたデータ 出典:Scribbr,‘Multiple Linear Regression | A Quick Guide (Examples)’ d <- read.csv("https://stats.dip.jp/01_ds/data/heart.data.csv")[, -1] library(kableExtra) kable(d)%>%kable_classic('st...
668 sym R (1157 sym/9 pcs) 6 img 4 tbl
時系列分析(深層学習)
d <- read.csv('https://stats.dip.jp/01_ds/data/load_amedas_y2017-2022_tokyo.csv') d$px <- as.POSIXct(d$datetime) d$gw <- d$mw / 1000 # 測定値 (単位変換:MW -> GW) d$gwhat <- NA # 予測値格納用 #d$gw.wkago <- c(rep(NA, 168), d$gw)[1:nrow(d)] # 追加説明変数(weekly AR) #d <- d[169:nrow(d), ] (n <- nrow(d)) ## [1] 52560 head(...
21 sym R (5942 sym/14 pcs) 5 img
時系列分析(RegARIMA)
回帰付きARIMA(RegARIMA,ARIMAXなどという) データ d0 <- read.csv('https://stats.dip.jp/01_ds/data/load_amedas_y2017-2022_tokyo.csv') head(d0) ## date datetime dow name event md gr year month ## 1 2017-01-01 2017-01-01 00:00:00 日 祝日:元日 年末年始 01-01 6 2017 1 ## 2 2017-01-01 20...
235 sym R (4567 sym/19 pcs) 6 img
データベース(暦/気象/電力需要)
暦 2010-01-01から作成。 カラム名 内容 date 日時(yyyy-mm-dd形式) dow 曜日 name 日種別名称(平日/休日/祝日) event 特異期間名称(年末年始/GW/お盆) md 月日(mm-dd形式) gr 曜日回り同一年グループ(4月1日の曜日番号; 日:1〜土:7) year 年(yyyy...
168 sym R (2263 sym/8 pcs) 4 tbl