Publications by Nguyen Chi Dung

Convolutional Neural Network (CNN) for Predicting Patients Infected Covid 19 from CT Scan Image

14.01.2022

Motivation and Problem Cuộc thi VinBigData Chest X-ray Abnormalities Detection của Vingroup Big Data Institute với dữ liệu scan có dung lượng (đã nén) là hơn 200 GB. Khối dữ liệu này nằm ngoài khả năng của con máy Dell Precision T5610 chỉ với 64 GB RAM. Do vậy trong post này sử dụng bộ dữ liệu t...

11825 sym R (7912 sym/10 pcs) 3 img

Florence Nightingale’s Data On Deaths From Various Causes In The Crimean War (Updated Version)

08.10.2021

Introduction In the history of data visualization, Florence Nightingale’s Rose Diagram has become one of the most famous data visualizations ever created. The story behind this diagram is fascinating. After witnessing deplorable sanitary conditions in the Crimea War, she wrote several influential texts (Nightingale, 1858, 1859), including polar...

11666 sym R (2584 sym/1 pcs) 3 img

Real-World Machine Learning: A Hands-on Approach using R

04.10.2021

Introduction to caret Nếu Python có thư viện scikit-learn cho các thuật toán Machine Learning thì R có caret - viết tắt của Classification And REgression Training. Có chừng không ít hơn 40 đầu sách về Machine Learning/Data Science sử dụng caret được bán trên Amazon. Một trong số đó là Applied Predict...

180547 sym R (47784 sym/164 pcs) 14 img 1 tbl

Structural Equation Modeling (SEM) Using R: Confirmatory Factor Analysis (CFA)

11.08.2021

Introduction Post trước giới thiệu về SEM (Structural Equation Modeling), ứng dụng trong nghiên cứu của SEM, sơ lược về các tools hiện có được sử dụng cho kĩ thuật phân tích này cũng như trình bày việc tái lập lại kết quả của một case được trình bày trong chương 7 cuốn Marketi...

6482 sym R (10384 sym/25 pcs) 6 img

How to Fake Data for Research Paper

09.08.2021

Introduction Trong khoảng 10 năm trở lại đây những nghiên cứu với thang đo Likert 5 dùng các phương pháp phân tích EFA, CFA, SEM trở thành một phong trào. Những phương pháp phân tích này chiếm một tỉ trọng lớn trong các nghiên cứu đăng tạp chí và PhD Thesis và điều đáng ngạc nhiên...

19932 sym R (15615 sym/21 pcs) 2 img

Simultaneously Train and Compare 125 Supervised Machine Learning Algorithms

29.08.2021

Introduction Nếu Python có thư viện scikit-learn cho các thuật toán học máy thì R có caret. Cho đến hiện tại có 238 thuật toán học máy, trong đó có 191 thuật toán học giám sát (Supervised Machine Learning Algorithms) cho bài toán phân loại được hỗ trợ bởi caret. Danh sách các thuật toán n...

6076 sym R (10864 sym/25 pcs) 2 img 2 tbl

Clustering Algorithms: A Real-world Case

13.09.2021

Introduction Nhóm thuật toán phân cụm (Clustering Algorithms) là nhóm thuật toán học không giám sát (unsupervised machine learning algorithm) thường được sử dụng để nhóm các quan sát thành k nhóm khác nhau (MacQueen, 1967) sao cho các quan sát thuộc cùng một nhóm là đồng nhất với nhau nhất c�...

6767 sym R (6625 sym/14 pcs) 5 img 2 tbl

Data Scraping from Web

18.09.2021

Collect data from a specific link Xét một link về vị trí công việc kế toán dưới đây: https://timviecnhanh.com/tuyen-ke-toan-truong-ha-noi-100111868.html?svs=max_box Giả sử chúng ta muốn lấy, ví dụ, vùng dữ liệu nằm trong hình chữ nhật viền đỏ dưới đây: Trước hết cần xác định cái g�...

6281 sym R (5945 sym/31 pcs) 6 img

Triangulated Maximally Filtered Graph (TMFG) for Portfolio Selection

05.11.2021

Motivations Nghiên cứu có tên Spread of risk across financial markets: better to invest in the peripheries của Pozzi et al. (2013) đã chỉ ra một hướng mới trong việc thiết lập danh mục đầu tư. Sử dụng dữ liệu về giá của các cổ phiếu niêm yết trên sàn American Stock Exchange (AMEX) từ 1981 đ...

39099 sym R (337 sym/6 pcs) 4 img 2 tbl

Using R for Trade Policy Analysis

15.03.2022

Motivation Năm 2012, United Nations Conference On Trade And Development - UNCTAD và WTO phát hành Practical Guide to Trade Policy Analysis - một tài liệu kết hợp cả khía cạnh lí thuyết và phân tích thực chứng cho thương mại quốc tế. UNCTAD và WTO công khai đầy đủ Stata Codes (và cả dữ liệu) cho n...

4103 sym R (7987 sym/17 pcs) 3 img