Publications by Nguyen Ngoc Thieu
Survival data Manipulation
Giới thiệu Bài này muốn giới thiệu các bước xử lí data để chuẩn bị cho phân tích survival. Khi phân tích survival hàm survival chính thường là: f1 <- survfit(Surv(time, status) ~ 1, data = lung) Trong đó dataset là “lung”, biến số biến cố sống, chết là “status” và thời gian theo dõi ...
8886 sym R (1063 sym/11 pcs) 1 img
Ranking Within Groups
Giới thiệu Nhiều trường hợp chúng ta cần lọc ra những rows là các giá trị ranking thứ nth trong các nhóm. Chọn giá trị nhỏ nhất, lớn nhất thì tương đối dễ dàng hơn chọn những giá trị có ranking thứ n bất kì (nth). Chúng ta lấy dataset iris để minh họa library(tidyverse) Regist...
2946 sym R (1595 sym/10 pcs)
Biểu Đồ Có 2 Y axis
Mục đích Trong một vài trường hợp chúng ta cần minh họa sự biến thiên tương đồng hoặc tương phản của 2 biến số theo một biến số chung nào đó. Ví dụ, số ca mắc mới covid19 hoặc số bệnh nhân ra viện sau lành bệnh do covid19 trong cùng thời điểm. Thông thường biến thiê...
1004 sym R (1902 sym/10 pcs) 4 img
SOME STATISTICAL CALCULATORS
Chi square test with counts Đôi khi trong những tình huống phân tích dữ liệu chúng ta cần kiểm định sự khác biệt số liệu trong các bảng bằng Chi square test. Chẳng hạn trong bảng sau, chúng ta cần biết khác biệt về giới tính giữa các nhóm có ý nghĩa thống kê hay không. M <- as.tabl...
6893 sym R (3402 sym/24 pcs) 1 img
Recoding values in R
Các packages: dplyr, sjmisc Nhu cầu đặt lại giá trị cho các biến số là thường gặp khi phân tích dữ liệu. VD như “nam” thành 1, “nữ” thành 0. Age được chia thành Age group. Những cách recoding values đơn giản, thường được sử dụng thông qua các packages như dplyr, Rmisc library(dply...
4720 sym R (2343 sym/15 pcs)
Counting AE in Clinical Research
Giới thiệu Trong các nghiên cứu lâm sàng, các Adverse Events thường được ghi nhận theo bệnh nhân, theo ngày. Vì thế có những bệnh nhân có nhiều AE khác nhau hoặc có một số AE lặp lại vài lần trong vài ngày. Báo cáo nghiên cứu thường yêu cầu thống kê lại các AE xảy ra ở bao ...
4065 sym R (932 sym/12 pcs)
Add an Average Moving Line to Chart
Bài này minh họa các bước để thêm một line thể hiện biến thiên trung bình hay trend của một biến số theo thời gian. Dữ liệu được sử dụng là Covid19 ở tỉnh Đồng Nai từ ngày 17/8/2021 đến 12/10/2021. Package TTR cần thiết để tạo nên data biến thiên trung của một variable. li...
3418 sym R (1073 sym/5 pcs) 1 img
Multiple Continuous Variable Summary
Summarise multiple continuous variables This is an R Markdown document. Markdown is a simple formatting syntax Để tiết kiệm thời gian chúng ta cần một cách mô tả tóm tắt nhiều biến số liên tục với kết quả được trình bày trong một bảng tóm tắt. library(tidyverse) library(readr) library(readxl) li...
5818 sym R (2679 sym/11 pcs)
Giải Thích về Đường Cong ROC Trong Xét Nghiệm Chẩn Đoán
Chuẩn bị data Data tải từ trang web Kaggle về máy tính. Bộ dữ liệu diabetes có nhiều biến số. Trong đó, tôi sử dụng biến số Glucose (mg/dL) và Outcome (chẩn đoán diabetes) để xây dựng ROC và tính các thông số liên quan như AUC, sensitivity, specificity, cutoff points … library(tidyverse) Re...
8347 sym R (4629 sym/23 pcs) 2 img