Publications by 東京国際大学 データサイエンス教育研究所 竹田 恒

棒グラフ

03.05.2024

データ #【データフレームの作成】 # カラム(列)u,v,wを持つデータフレームを作成する。 d <- data.frame( u = c(10, 20, 30), v = c(40, 80, 90), w = c(20, 50, 40)) #【レコード名(行名)の作成】 # ISO形式("yyyy-mm-dd")で開始日,終了日を作成し, # 時間オブジェ�...

249 sym R (5493 sym/21 pcs) 8 img 1 tbl

DuckDB

25.04.2024

R library("duckdb") library("dplyr") # テストデータ d <- data.frame(id = c(1, 2, 3), name = c('A', 'B', 'C')) # dをCSVファイル形式で保存 write.csv(d, 'test_R.csv') # DB接続/新規作成 # con <- dbConnect(duckdb()) con <- dbConnect(duckdb("test_db_R.duckdb")) # # 保存したファイルからデータ読み込み�...

27 sym R (2168 sym/10 pcs)

Sample Solution

28.02.2024

#2.Визуальный анализ временного ряда plot(Sample1$Ряд3, type="l") # 3.Стационарность============================================================================================= # 1)Сначала строим график частичной автокорреляции, он нужен для оп...

68 sym 11 img

Apache Parquet

19.02.2024

library(data.table) library(arrow) library(microbenchmark) library(ggplot2) 1 データ nr <- 100000 nc <- 200 n <- nr * nc d <- matrix(rnorm(n), nrow = nr, ncol = nc) |> as.data.frame() #d <- matrix('あ', nrow = nr, ncol = nc) |> as.data.frame() 2 書き込み速度 書き込みはParquetよりCSV最速処理(data.table::fwrite)の�...

363 sym R (655 sym/8 pcs) 2 img

Time Series

28.01.2024

library(readxl) gdp <- read_excel("GDP per capita from 1800.xlsx") View(gdp) # загружаем файл GDP per capita from 1800 GDP<-log(gdp$Italy) plot(GDP, type = "l") acf(GDP, type='partial', na.action = na.omit) Pacf(GDP) ACF и PACF Значения графика ACF уходят в ноль после 1-ого лага,след�...

2215 sym R (13087 sym/67 pcs) 13 img

Excel連携

15.01.2024

1 データ 次のデータフレームのデータを用いて説明する。 d1 <- data.frame(name = c('太郎', '花子'), age = c(18, 19)) d1 ## name age ## 1 太郎 18 ## 2 花子 19 2 ワークブックオブジェクトの作成 「asTable = TRUE」のオプションを付けるとExcelの表形式フォーマットを 適用する...

1110 sym R (2264 sym/23 pcs) 3 img

dplyr処理演習

11.01.2024

Rパッケージdplyrを用いて、以下の設問の表示結果と同じになるように、Rチャンクを挿入しコーディングせよ。 データを次に示す。 library(tidyverse) d <- data.frame( name = c("太郎", "花子", "三郎", "良子", "次郎", "桜子", "四郎", "松子", "愛子"), school = c("南", "南", "�...

878 sym R (4358 sym/15 pcs)

データベース処理

11.01.2024

データベースの基本操作 データ分析に特化したデータベースである DuckDBを使用する。 このデータベースは列指向(columnar)で、 オンライン分散処理(OLAP)を行い高速なSQL処理が可能。 CSV、Parquet形式のフィイルからデータ入力できる。 SQLiteと同等以上の性...

451 sym R (2772 sym/12 pcs)

データ収集(政府統計データ)

09.01.2024

APIを用いたデータの収集(政府統計データ) e-Stat(政府統計の総合窓口) は、日本の統計が閲覧できる政府統計ポータルサイトです. 出典:【総務省 ICTスキル総合習得教材】4-3(一部改変) APIの取得 #install.packages('estatapi') library(estatapi) ## このサービスは、�...

127 sym R (3313 sym/9 pcs) 1 img

R設定ファイル(.Rprofile)

16.12.2023

R設定ファイル(.Rprofile)とは R設定ファイル(.Rprofile)は、Rを起動するときに毎回自動で実行されるスクリプト。 時刻・地域やフォントの設定のほか,よく使う自作関数などもこれに記入しておくと便利。 起動されたRは、次の順でR設定ファイル(.Rprofile)�...

393 sym R (3841 sym/11 pcs)