Publications by Nguyen Chi Dung
Machine Learning Algorithms for Housing Price Prediction
Motivation Cuộc thi Zillow’s Home Value Prediction có tổng giải thưởng lên đến $1,200,000. Bộ dữ liệu này ngay cả khi đã nén có dung lượng 1.37 GB. Để test khả năng dự báo của các mô hình khác nhau chúng ta có thể sử dụng bộ dữ liệu bé hơn và đơn giản hơn là Boston Housing D...
14790 sym 2 img 1 tbl
Prostitutes in Vietnam: Estimate Daily Revenue from Webscraped Data
Motivations Vào năm 2013 (tức 10 năm trước), bộ Lao Động - Thương Binh - Xã Hội ước tính rằng có 71,936 gái mại dâm (GMD) tại việt Nam. Trong bài viết Will Vietnam Legalize Prostitution? ước tính rằng có 200,000 GMD vào năm 2016. Để có bức tranh sơ bộ về hoạt động mại dâm (sau đâ...
4193 sym 7 img 4 tbl
EEG Brainwave Data for Emotional Sentiment Classification using Auto Machine Learning
Motivations Công ti Earable Neuroscience chi nhánh tại Việt Nam đăng tuyển hai vị trí là Machine Learning Engineer và Head of Machine Learning trong đó phần mô tả công việc của ML Engineer là Analyze EEG/EMG/EOG brain signals to predict user states such as focus, stress, emotion, sleep stages, and other relevant in...
3706 sym Python (7017 sym/10 pcs) 2 img
Học bổng học kì 2 năm học 2022-2023, ĐHBK Hà Nội
R Codes # Download data from https://ctt.hust.edu.vn/DisplayWeb/DisplayBaiViet?baiviet=41346&fbclid=IwAR3nemyk6PQhK36NCTIAvs1KwdXO3B1s0ZelOz8IdlwHo5U4Y3S35ZbzhZ0 library(pdftools) library(tidyverse) txt <- pdf_text("DS SV được HB KKHT đăng web.pdf") %>% readr::read_lines() txt[-c(1:6)] -> hocbong hocbong %>% str_split(pattern = ...
6647 sym Python (4275 sym/1 pcs) 1 img
Python Test (VietinBank Python Course)
# =================== # Test 1 # =================== # Function calculates FV: def fv(pv, r, n): pv = pv * (1 + r) ** n return pv # Use the function: fv(pv=1152300, r=0.089, n=8) # ===================== # Test 2 # ===================== # Explanation: so_tien_ban_dau = 100000000 lai_suat1 = 0.1 my_years = ...
11 sym Python (6238 sym/1 pcs)
Regression Task (VietinBank Python Course)
# =============================== # Part 1: Basic Regression # =============================== # Load pandas library: import pandas as pd # Load data: data_path = "C:\\Users\\Admin\\Documents\\boston.csv" df = pd.read_csv(data_path) # Extract info: df.info() df.describe() # ------------------- # EDA # -------------------...
11 sym Python (10050 sym/1 pcs)
Clustering Task - VietinBank Python Course
# ============================================= # K-means Clustering: A Short Introduction # ============================================= #------------------------------- # K-means Clustering Basics #------------------------------- # Creat data for illustration from sklearn.datasets._samples_generator import make_blobs X, y_true = ma...
11 sym Python (6608 sym/1 pcs)
Credit Scoring/Classification Task - VietinBank Python Course, Part 1
Motivations Tinh chỉnh các tham số để tối ưu hóa một tiêu như ROC-AUC chưa phải là mục tiêu của một tổ chức có mục đích là tối đa hóa lợi nhuận. Trong project này, với bộ số liệu GermanCredit.csv về cấp tín dụng của một ngân hàng đại Đức thì GaussianNB, Random Forest và C...
1257 sym Python (4395 sym/1 pcs)
Credit Scoring/Classification Task - VietinBank Python Course, Part 2
Motivations Trong project này chúng ta sẽ tìm hiểu tác động của việc sử dụng các tham số mà tối ưu AUC bằng Bayesian Optimization lên mức lợi nhuận tối đa (maximum profit) giữa Random Forest không được tinh chỉnh và Random Forest được tinh chỉnh. # =============================== # Prepare ...
264 sym Python (9320 sym/2 pcs)
Python Test, ViettinBank - April 2023
Python Test, ViettinBank - April 2023 Python Series Python Test, ViettinBank - April 2023 Giới thiệu Test 1 Test 2 Test 3 Test 4 Test 5 Test 6 Preparation Test for Python Course Giới thiệu Bài test này được sử dụng để đánh giá mức độ thành thạo sử dụng Python dành cho những học viên đã hoàn thàn...
2404 sym