Publications by Nguyen Chi Dung
Convolutional Neural Network (CNN) for Predicting Patients Infected Covid 19 from CT Scan Image
Motivation and Problem Cuộc thi VinBigData Chest X-ray Abnormalities Detection của Vingroup Big Data Institute với dữ liệu scan có dung lượng (đã nén) là hơn 200 GB. Khối dữ liệu này nằm ngoài khả năng của con máy Dell Precision T5610 chỉ với 64 GB RAM. Do vậy trong post này sử dụng bộ dữ liệu t...
11825 sym R (7912 sym/10 pcs) 3 img
Florence Nightingale’s Data On Deaths From Various Causes In The Crimean War (Updated Version)
Introduction In the history of data visualization, Florence Nightingale’s Rose Diagram has become one of the most famous data visualizations ever created. The story behind this diagram is fascinating. After witnessing deplorable sanitary conditions in the Crimea War, she wrote several influential texts (Nightingale, 1858, 1859), including polar...
11666 sym R (2584 sym/1 pcs) 3 img
Real-World Machine Learning: A Hands-on Approach using R
Introduction to caret Nếu Python có thư viện scikit-learn cho các thuật toán Machine Learning thì R có caret - viết tắt của Classification And REgression Training. Có chừng không ít hơn 40 đầu sách về Machine Learning/Data Science sử dụng caret được bán trên Amazon. Một trong số đó là Applied Predict...
180547 sym R (47784 sym/164 pcs) 14 img 1 tbl
Structural Equation Modeling (SEM) Using R: Confirmatory Factor Analysis (CFA)
Introduction Post trước giới thiệu về SEM (Structural Equation Modeling), ứng dụng trong nghiên cứu của SEM, sơ lược về các tools hiện có được sử dụng cho kĩ thuật phân tích này cũng như trình bày việc tái lập lại kết quả của một case được trình bày trong chương 7 cuốn Marketi...
6482 sym R (10384 sym/25 pcs) 6 img
How to Fake Data for Research Paper
Introduction Trong khoảng 10 năm trở lại đây những nghiên cứu với thang đo Likert 5 dùng các phương pháp phân tích EFA, CFA, SEM trở thành một phong trào. Những phương pháp phân tích này chiếm một tỉ trọng lớn trong các nghiên cứu đăng tạp chí và PhD Thesis và điều đáng ngạc nhiên...
19932 sym R (15615 sym/21 pcs) 2 img
Simultaneously Train and Compare 125 Supervised Machine Learning Algorithms
Introduction Nếu Python có thư viện scikit-learn cho các thuật toán học máy thì R có caret. Cho đến hiện tại có 238 thuật toán học máy, trong đó có 191 thuật toán học giám sát (Supervised Machine Learning Algorithms) cho bài toán phân loại được hỗ trợ bởi caret. Danh sách các thuật toán n...
6076 sym R (10864 sym/25 pcs) 2 img 2 tbl
Clustering Algorithms: A Real-world Case
Introduction Nhóm thuật toán phân cụm (Clustering Algorithms) là nhóm thuật toán học không giám sát (unsupervised machine learning algorithm) thường được sử dụng để nhóm các quan sát thành k nhóm khác nhau (MacQueen, 1967) sao cho các quan sát thuộc cùng một nhóm là đồng nhất với nhau nhất c�...
6767 sym R (6625 sym/14 pcs) 5 img 2 tbl
Data Scraping from Web
Collect data from a specific link Xét một link về vị trí công việc kế toán dưới đây: https://timviecnhanh.com/tuyen-ke-toan-truong-ha-noi-100111868.html?svs=max_box Giả sử chúng ta muốn lấy, ví dụ, vùng dữ liệu nằm trong hình chữ nhật viền đỏ dưới đây: Trước hết cần xác định cái g�...
6281 sym R (5945 sym/31 pcs) 6 img
Triangulated Maximally Filtered Graph (TMFG) for Portfolio Selection
Motivations Nghiên cứu có tên Spread of risk across financial markets: better to invest in the peripheries của Pozzi et al. (2013) đã chỉ ra một hướng mới trong việc thiết lập danh mục đầu tư. Sử dụng dữ liệu về giá của các cổ phiếu niêm yết trên sàn American Stock Exchange (AMEX) từ 1981 đ...
39099 sym R (337 sym/6 pcs) 4 img 2 tbl
Using R for Trade Policy Analysis
Motivation Năm 2012, United Nations Conference On Trade And Development - UNCTAD và WTO phát hành Practical Guide to Trade Policy Analysis - một tài liệu kết hợp cả khía cạnh lí thuyết và phân tích thực chứng cho thương mại quốc tế. UNCTAD và WTO công khai đầy đủ Stata Codes (và cả dữ liệu) cho n...
4103 sym R (7987 sym/17 pcs) 3 img