Publications by Nguyen Chi Dung
Real-World Machine Learning: A Hands-on Approach using R
Introduction to caret Nếu Python có thư viện scikit-learn cho các thuật toán Machine Learning thì R có caret - viết tắt của Classification And REgression Training. Có chừng không ít hơn 40 đầu sách về Machine Learning/Data Science sử dụng caret được bán trên Amazon. Một trong số đó là Applied Predict...
180547 sym R (47784 sym/164 pcs) 14 img 1 tbl
Structural Equation Modeling (SEM) Using R: Confirmatory Factor Analysis (CFA)
Introduction Post trước giới thiệu về SEM (Structural Equation Modeling), ứng dụng trong nghiên cứu của SEM, sơ lược về các tools hiện có được sử dụng cho kĩ thuật phân tích này cũng như trình bày việc tái lập lại kết quả của một case được trình bày trong chương 7 cuốn Marketi...
6482 sym R (10384 sym/25 pcs) 6 img
How to Fake Data for Research Paper
Introduction Trong khoảng 10 năm trở lại đây những nghiên cứu với thang đo Likert 5 dùng các phương pháp phân tích EFA, CFA, SEM trở thành một phong trào. Những phương pháp phân tích này chiếm một tỉ trọng lớn trong các nghiên cứu đăng tạp chí và PhD Thesis và điều đáng ngạc nhiên...
19932 sym R (15615 sym/21 pcs) 2 img
Simultaneously Train and Compare 125 Supervised Machine Learning Algorithms
Introduction Nếu Python có thư viện scikit-learn cho các thuật toán học máy thì R có caret. Cho đến hiện tại có 238 thuật toán học máy, trong đó có 191 thuật toán học giám sát (Supervised Machine Learning Algorithms) cho bài toán phân loại được hỗ trợ bởi caret. Danh sách các thuật toán n...
6076 sym R (10864 sym/25 pcs) 2 img 2 tbl
Clustering Algorithms: A Real-world Case
Introduction Nhóm thuật toán phân cụm (Clustering Algorithms) là nhóm thuật toán học không giám sát (unsupervised machine learning algorithm) thường được sử dụng để nhóm các quan sát thành k nhóm khác nhau (MacQueen, 1967) sao cho các quan sát thuộc cùng một nhóm là đồng nhất với nhau nhất c�...
6767 sym R (6625 sym/14 pcs) 5 img 2 tbl
Data Scraping from Web
Collect data from a specific link Xét một link về vị trí công việc kế toán dưới đây: https://timviecnhanh.com/tuyen-ke-toan-truong-ha-noi-100111868.html?svs=max_box Giả sử chúng ta muốn lấy, ví dụ, vùng dữ liệu nằm trong hình chữ nhật viền đỏ dưới đây: Trước hết cần xác định cái g�...
6281 sym R (5945 sym/31 pcs) 6 img
Triangulated Maximally Filtered Graph (TMFG) for Portfolio Selection
Motivations Nghiên cứu có tên Spread of risk across financial markets: better to invest in the peripheries của Pozzi et al. (2013) đã chỉ ra một hướng mới trong việc thiết lập danh mục đầu tư. Sử dụng dữ liệu về giá của các cổ phiếu niêm yết trên sàn American Stock Exchange (AMEX) từ 1981 đ...
39099 sym R (337 sym/6 pcs) 4 img 2 tbl
Using R for Trade Policy Analysis
Motivation Năm 2012, United Nations Conference On Trade And Development - UNCTAD và WTO phát hành Practical Guide to Trade Policy Analysis - một tài liệu kết hợp cả khía cạnh lí thuyết và phân tích thực chứng cho thương mại quốc tế. UNCTAD và WTO công khai đầy đủ Stata Codes (và cả dữ liệu) cho n...
4103 sym R (7987 sym/17 pcs) 3 img
Information Value for Feature Selection: Corporate Bankruptcy Prediction from Kaggle 2021 Competition
Motivation Trong post trước chúng ta đã sử dụng AUC để lựa chọn biến số cho mô hình Logistic để đạt được AUC = 0.903. Chúng ta có thể đạt được thứ hạng cao hơn nữa (cao hơn vị trí thứ hai của Team yoshida có AUC trên Test Data = 0.93293) với kĩ thuật lựa chọn biến số dựa ...
18253 sym R (9878 sym/27 pcs) 2 img
Corporate Bankruptcy Prediction: Empirical Evidence from Taiwanese Firms
Motivation Dự báo phá sản của các doanh nghiệp (Corporate Bankruptancy) bao gồm cả các tổ chức tài chính đã có nhiều tác giả nghiên cứu. Tại Việt Nam thì có luận văn Tiến Sĩ của tác giả Đặng Huy Ngân với đề tài Xây dựng mô hình cảnh báo nguy cơ vỡ nợ đối với các ngân ...
33783 sym R (37049 sym/20 pcs) 4 img 2 tbl