Publications by DOEUN
Business Examples
#library(DT) #library(knitr) #library(rmarkdown) #library(markdown) Chapter 3: 왜 매상이 감소하는가? STEP 1 < 현재의 Fact 와 원하는 Ideal 케이스에 대한 정의를 간단하게 내린다 > 현재: 매출이 떨어짐 해결: 지난달과 비슷한 매출을 확보해야한다 STEP 2 < 매출 감소의 원인에 �...
28801 sym R (14094 sym/67 pcs) 4 img
Customer Segment RFM
RFM RFM 모형은 거래량을 통해 고객들의 행동을 분석하는 것이다. R 은 recency ; 얼마나 최근에 고객들이 구매 했는가 F 은 frequency : 얼마나 자주 구매하는가 M 은 monetry : 얼만큼의 돈을 지불하는가 RFM 모형은 다양한 고객 카테고리 중 프로모션에 가장 잘 반응하는 고객...
10527 sym R (3415 sym/12 pcs) 10 img
supervised manchine learning
1. KNN - WINE Caret package trainControl() - 훈련과정 중 parameter 설정 Ex) trainControl ( method = “repeatedcv” number = 10, <- 훈련데이터 fold 갯수 repeat - 5) <- cv 반복 횟수 expand.grid() - factor 조합의 데이터 프레임 생성 Ex) expand.grid (k=1:10) train() Ex) train ( Class ~. , data = method= trContraol prePro...
18049 sym R (23688 sym/60 pcs) 11 img
PCA
PCA - Iris Species - 범주 나머지 - 연속형 head(iris) ## Sepal.Length Sepal.Width Petal.Length Petal.Width Species ## 1 5.1 3.5 1.4 0.2 setosa ## 2 4.9 3.0 1.4 0.2 setosa ## 3 4.7 3.2 1.3 0.2 setosa ## 4 4.6 3.1 ...
19352 sym R (21496 sym/97 pcs) 32 img
공공데이터
Citizen In Seoul EDA setwd("C:/Users/Administrator/Desktop/R Analysis") ## 데이터 불러오기 data_2019 = read.csv('Data/SEOUL_PEOPLE_GU_2019.csv', fileEncoding='UTF-8', colClasses=c(`시간대`='character')) data_2020 = read.csv('Data/SEOUL_PEOPLE_GU_2020.csv', fileEncoding='UTF-8', ...
20261 sym R (36095 sym/75 pcs) 11 img
Decisiton Tree_ KNN
Decision Tree 2.1 Decision Tree 순수도를 더 이상 높일 수 없거나, 말단 노드에 포함된 개체의 수가 사전에 정한 최소값에 도달하였을 때, 노드의 깊이가 사전에 정해놓은 한계에 이를때 재귀적 분할 반복이 일어난다. 지니척도 복원 추출했을때의 동일 범주가 개체가 �...
11529 sym R (10861 sym/34 pcs) 14 img
Cohort Analysis (Sales)
Introduction Cohort Analysis 는 고객의 retention/chrun(이탈)에 대한 분석이다. 고객의 트렌드에 대한 이해를 높히며, 소비자 타켓을 구축하거나, 의사 결정에 도움을 주는 분석 기법이다. UCI 의 Online Retail Data 를 활용하여 분석을 실시한다. Preprocessing: Features setwd('C:/Users/Admin...
30001 sym R (22392 sym/43 pcs) 9 img
마케팅 예측
Marketing Evaluation setwd("C:/Users/Administrator/Desktop/R Analysis/Fast Campus") read.csv("bank.csv") -> raw_df str(raw_df) ## 'data.frame': 600 obs. of 20 variables: ## $ age : int 28 68 31 31 77 39 35 41 30 43 ... ## $ job : chr "services" "retired" "services" "entrepreneur" ... ## $ marital : chr "s...
12957 sym R (33358 sym/70 pcs) 11 img
지도학습 SVM & Logistic
SVM (Support Vector Machine) 1.1 SVM 2개 이상의 집단 분류에 사용되는 기법 이상치 영향이 가장 적음 마진 경계를 최대로하는 서포트 벡터를 찾는 방법 1.2 Hyperplane 데이터와 데이터 사이의 거리 = Margin Margin 에서 가까운 데이터 = Support Vector Margin 과 Support Vector를 이용하�...
15624 sym R (18556 sym/49 pcs) 9 img 1 tbl
Torono Shelter & Sales
Toronto Shelter clearning : 날짜 변수를 year, month 로 나눔 년도별, occupancy gruop_by(년도), summarise 합계를 구해서 geom_point 연결 월별 capcity 비율 year 세분화 shleter 이름의 중복을 제거해주고, occupancy 와 capacity 의 year 별 합계를 구하고, 나눠서 그 비율을 구함 Waffle Chart - 각...
8551 sym R (4656 sym/6 pcs) 2 img