Publications by 東京国際大学 データサイエンス教育研究所 竹田 恒

時系列分析(時系列分解)

22.01.2023

時系列分解 時系列データがトレンドや周期的に変動する成分などで構成されていると考え, 分析や予測のために,それらの成分系列を取り出すことを 時系列分解 (time series decomposition)という。 季節調整でよく使用される。 【季節調整】 季節調整(seasonal ...

848 sym R (5726 sym/20 pcs) 9 img 1 tbl

時系列分析(重回帰)

23.01.2023

重回帰を使った時系列分析 単純な例(トレンドモデル) n <- 100 # 全時間 x <- 1:n # 時刻 t <- 2 * x # トレンド(係数:2) e <- rnorm(n, mean = 0, sd = 10) # 不規則変動 y <- t + e # 合成変動 matplot(x, y, typ...

477 sym Python (8302 sym/12 pcs) 9 img

相関分析

28.01.2023

データ d <- data.frame( u = c(7, 4, 6, 2, 9, 3, 8, 1, 6, 3), v = c(3, 6, 5, 8, 3, 4, 2, 9, 2, 6), w = c(6, 3, 4, 9, 1, 8, 4, 2, 5, 7)) library(kableExtra) kable(d, full.width = F)%>%kable_classic('striped') u v w 7 3 6 4 6 3 6 5 4 2 8 9 9 3 1 3 4 8 8 2 4 1 9 2 6 2 5 3 6 7 要約統計量 summary(d) ## ...

272 sym R (1957 sym/16 pcs) 3 img 2 tbl

時系列分析(ARIMA)

28.01.2023

データ 月間航空旅客数のデータを使用する。 y <- c(AirPassengers) # 月間航空旅客数 n <- length(y) # 月数 n.tr <- 120 # 訓練月数 n.te <- n - n.tr # テスト月数 t <- 1:n # 月 ii.tr <- 1:120 # 訓練期間インデックス ii.te <- 121:n # テスト期間インデ�...

2601 sym R (4428 sym/23 pcs) 10 img 1 tbl

Q-Qプロット

24.09.2022

2つの分布形状を分位数を用いて比較するための散布図を Q-Qプロット(quantile-quantile plot)という。 類似していればプロットが直線状にならぶので視覚的に分かり易い。 データ 正規乱数とt乱数から得られた2つの標本を用いる。 set.seed(10) n <- 100 #...

988 sym R (1179 sym/10 pcs) 6 img

分位数を用いた分布の比較

24.09.2022

データ 次の2つの標本X1,X2を比較に用いる。 X2はX1の約10倍の尺度を持つ。 x1 <- c(1, 2, 3, 4, 5, 5, 6, 7, 8) x2 <- c(10, 20, 25, 40, 50, 50, 65, 70, 80) hist(x1) hist(x2) 四分位数 (q1 <- quantile(x1, probs = c(1/4, 2/4, 3/4))) ## 25% 50% 75% ## 3 5 6 (q2 <- quantile(x2, probs = c(1/4, 2/4, 3/4))) ## 25...

126 sym 3 img

残差分析

26.09.2022

データ x <- 1:30 y <- seq(1, 300, 10) + rnorm(30) 外れ値 y[5] <- y[5] + 10 y[10] <- y[10] + 5 y[25] <- y[25] - 10 fit <- lm(y ~ x) plot(fit) ...

21 sym 4 img

Group_21

16.12.2022

#Код 21 группы к проекту по эконометрике Подготовка к работе Загрузка пакетов library(readr) library(dplyr) library(tidyr) library(ggplot2) library(GGally) library(sandwich) library(lmtest) library(car) library(broom) library(xtable) library(ggpubr) library(stargazer) library(modelsum...

1622 sym R (16978 sym/50 pcs) 4 img 1 tbl

分類(ロジスティック回帰モデル)

24.12.2022

どのぐらい受験勉強したら大学に合格するか, 1日の平均勉強時間ごとの合格確率を知りたい。 データ 1日の平均勉強時間[hour]とある大学の合否(1:合格,0:不合格) の仮想的データ d <- read.csv(file = "univ_exam_data.csv") library(kableExtra) knitr::kable(d, caption = ...

429 sym R (1660 sym/8 pcs) 1 img 1 tbl

分類(ロジスティック回帰モデル)演習

28.12.2022

次のデータを用いて新車購入の確率を予測する。 データ User.ID:お客様番号 Gender:性別(Male:男性,Female:女性) Age: 年齢 AnnualSalary:年収(US$) Purchased:新車購入の有無(1:購入,0:未購入) options(digits = 2) d <- na.omit(read.csv(file = "car_data.csv")) (n <- nrow(d)) ## [...

636 sym R (9386 sym/26 pcs) 1 img