Publications by Tony

Correlation Matrix in R

25.09.2020

1 引言 相关关系(Correlation)研究是在健康领域非常常用的一种研究。 1.1 相关: 事物或信号之间的共变关系或因果关系。统计上一般指两变量间存在线性关系。 1.2 统计方法选择 1.2.1 连续变量资料 皮尔逊积矩相关系数(Pearson product-moment correlation coefficient)适�...

972 sym R (7666 sym/27 pcs) 13 img

长宽数据操作转换

25.09.2020

1 引言 数据集有长数据、宽数据之分。原生数据一般为宽数据,以其适合录入、查看、比较,这类数据的基本特点是:每一个观测(observation)占一行,每一个测量值(measurement)占一列。这时并不是每一列都是变量(variable),也就是说一个变量可能分解占位在不...

17008 sym R (3849 sym/28 pcs)

Wrangling Data

12.09.2020

1 引言 数据集有长数据、宽数据之分。原生数据一般为宽数据,以其适合录入、查看、比较,这类数据的基本特点是:每一个观测(observation)占一行,每一个测量值(measurement)占一列。这时并不是每一列都是变量(variable),也就是说一个变量可能分解占位在不...

15669 sym R (3193 sym/25 pcs)

批量建模

24.10.2020

1 引言 本文介绍批量建模操作、结果规整、可视化。 2 加载宏包 # Load libraries library(tidyverse) # Easily Install and Load the 'Tidyverse' library(modelr) # Modelling Functions that Work with the Pipe # library(showtext) # Using Fonts More Easily in R Graphs # showtext_auto() 3 建模方法 以mtcars数据为例�...

5581 sym R (4842 sym/22 pcs) 2 img

在R制图中使用中文或特定字体的解决方案

21.10.2020

1 引言 R语言默认可以自由使用的字体只有sans(系统默认), serif和 mono三种,如果想要使用中文字体或者特定英文等其他字体,就需要借助第三方工具包。这里主要介绍{showtext}和{extrafont}。 2 操作程序 2.1 showtext包 优点: 可以使用.ttc等格式文件 可以使用ggsave保�...

877 sym R (22419 sym/23 pcs) 5 img

批量制作图片

24.10.2020

1 引言 本文介绍一下R语言的批量作图操作。 2 加载宏包 # Load libraries library(tidyverse) 本人以iris数据集为例。 ## # A tibble: 9 x 5 ## # Groups: Species [3] ## Sepal.Length Sepal.Width Petal.Length Petal.Width Species ## <dbl> <dbl> <dbl> <dbl> <fct> ## 1 5.4 ...

190 sym R (1704 sym/11 pcs) 6 img

Creating and transforming the datasets

11.12.2020

0.1 引言 本文介绍在R语言中非导入的方式原始创建各类数据的方法。 0.2 标量(Scalars) 标量标量是只含一个元素的向量,可以用以下方式赋值: f <- 3L g <- "US" h <- TRUE class(f) ## [1] "integer" mode(f) ## [1] "numeric" typeof(f) ## [1] "integer" class(g) ## [1] "character" class(h) ## [1] "logica...

33441 sym R (6838 sym/85 pcs)

purrr包应用

03.12.2020

1 purrr风格函数(匿名函数) 1.1 一元函数 若要表达 \(f(x) = x ^ 2 + 1\) purrr风格 ~ .x ^ 2 + 1 #其中.x是序列参数 Base R风格 function(x) x^2+1 1.2 二元函数 若要表达\(f(x, y) = x ^ 2 + 3y\) purrr风格 ~ .x ^ 2 + 3 * .y # 其中.x,.y是序列参数 Base R风格 function(x, y) x ^ 2 + 3 * y 1.3 �...

149654 sym R (39294 sym/73 pcs)

R语言数据科学在现场流行病学调查分析中的应用

24.11.2020

1990年8月25日在泰国某大学召开国家残障运动会后20小时,485人餐后2-3小时出现了上消化道症状。当时大约1300人参会,包括老师、学生、教练和残障人氏。次日,流行病学专家组进驻开展调查。 1 材料与方法 1.1 数据探索性分析 1.2 描述性流行病学研究 三间分布 �...

2792 sym R (2795 sym/3 pcs) 9 img

R语言数据科学在暴发调查分析中的应用

20.11.2020

#载入相关宏包 library(EpiStats) library(lubridate) library(tidyverse) library(magrittr) setwd("D:/food_borne_outbreaks/outbreak") #读入数据 os <- read.csv("oswego1.csv") ## 数据规整 oswego1 <- os %>% mutate( sex = factor( sex, levels = c('M', 'F'), labels = c('男性', '女性') ), ons...

1959 sym R (12847 sym/29 pcs) 15 img