Publications by Nguyen Chi Dung
Data Wrangling and Visualization with R (Course 14, Hanoi - March 2023)
Data Wrangling and Visualization with R (Course 14, Hanoi - March 2023) R Data Science Series Data Wrangling and Visualization with R (Course 14, Hanoi - March 2023) Course Introduction Objectives Some Key Definitions Why Data Wrangling Is Necessary? Why Data Visualization Is Necessary? Final Products Data Used Software ...
7958 sym 6 img
Spatial Data Visualization Course
Motivations Hình ảnh hóa dữ liệu (Data Visualization) nói chung và hình ảnh hóa dữ liệu không gian (Spatial Data Visualization) thường là phần không thể thiếu trong các báo cáo cũng như nghiên cứu liên quan đến các vấn đề kinh tế - xã hội. Dưới đây là một vài ví dụ điển hình:...
7114 sym Python (13778 sym/44 pcs) 22 img
Bump Chart for PCI 2018 Score
Introduction This post is inspired by David Sjoberg and Cédric Scherer. R codes R Codes for creating the chart: #========================== # Prepare data for ploting #========================== # Clear our R environment: rm(list = ls()) # Load Geeospatial Data (downloaded from https://data.opendevelopmentmekong.net/vi/dataset/a-phn-...
130 sym Python (8661 sym/1 pcs) 1 img
Investment climate change from 2011 to 2020 based on PCI score
Introduction This post is inspired by Denise Lu and Albert Sun and a post by Cole Nussbaumer Knaflic. R codes R Codes for creating the chart: #=========================== # Prepare data for ploting #=========================== rm(list = ls()) # Load data: readxl::read_excel("PCI_20111020.xlsx") -> pci_data # Select some columns: ...
160 sym Python (7195 sym/1 pcs) 1 img
Dual y-axis with ggplot2: Safe Skies
Motivations The original plot created by The Economist and you can see here. R can be used for recreating this plot as follow: R codes R codes for the plot: # Clear workspace: rm(list = ls()) # Import data: library(tidyverse) aviation <- read_csv("https://raw.githubusercontent.com/onlyphantom/safeskies/master/aviation.csv") # Rename fo...
6827 sym R (4160 sym/1 pcs) 1 img
SIR model for understanding Coronavirus pandemic
Motivations Trong báo cáo có tên ĐÁNH GIÁ TÁC ĐỘNG CỦA COVID-19 ĐẾN NỀN KINH TẾ VÀ CÁC KHUYẾN NGHỊ CHÍNH SÁCH tại trang 10 có sử dụng mô hình SIR (tên đầy đủ là Susceptibles-Infectious-Recovered (SIR) epidemic model) đưa ra con số dự báo tương ứng với ba kịch bản khác nhau và ảnh h...
15606 sym R (2373 sym/2 pcs) 2 img
Coronavirus cases in Vietnam
Motivations Chức năng của Graph là truyền tải các insights cho người tiếp nhận thông tin. Khi nào chức năng này mà không làm được, hoặc gây hiểu lầm, hoặc não người mất quá nhiều thời gian để hiểu insight trong graph được trình bày, thì coi như graph chưa làm được chức năng ...
10610 sym R (5954 sym/1 pcs) 1 img
Deaths by Coronavirus between China and Italy
Deaths by Coronavirus and Confirmed Cases R codes: # Load some packages: library(tidyverse) library(lubridate) # Current time: TODAY <- today() # Data links (source: https://github.com/CSSEGISandData/COVID-19): link1 <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_...
6261 sym R (4113 sym/2 pcs) 2 img
Corona Virus Prevalence by Country
Corona Virus Prevalence R codes for interactive map: # Load data (source: https://github.com/CSSEGISandData/COVID-19): library(tidyverse) library(lubridate) library(countrycode) link1 <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_19-covid-Recovered.csv" link2 ...
4337 sym R (2662 sym/1 pcs)
Automated Machine Learning for Credit Scoring Problem
About Automated Machine Learning Việc xây dựng các mô hình Machine Learning là một quá trình và hầu hết nguồn lực được tập trung vào hai giai đoạn là Feature Engineering và Turning Hyperparameters. Nhưng hai khâu này có thể là một thách thức với những người mà không thành thạo Machine Lear...
26876 sym R (12473 sym/19 pcs) 1 img 3 tbl