Publications by DOEUN

Business Examples

02.02.2021

#library(DT) #library(knitr) #library(rmarkdown) #library(markdown) Chapter 3: 왜 매상이 감소하는가? STEP 1 < 현재의 Fact 와 원하는 Ideal 케이스에 대한 정의를 간단하게 내린다 > 현재: 매출이 떨어짐 해결: 지난달과 비슷한 매출을 확보해야한다 STEP 2 < 매출 감소의 원인에 �...

28801 sym R (14094 sym/67 pcs) 4 img

Customer Segment RFM

25.02.2021

RFM RFM 모형은 거래량을 통해 고객들의 행동을 분석하는 것이다. R 은 recency ; 얼마나 최근에 고객들이 구매 했는가 F 은 frequency : 얼마나 자주 구매하는가 M 은 monetry : 얼만큼의 돈을 지불하는가 RFM 모형은 다양한 고객 카테고리 중 프로모션에 가장 잘 반응하는 고객...

10527 sym R (3415 sym/12 pcs) 10 img

supervised manchine learning

19.02.2021

1. KNN - WINE Caret package trainControl() - 훈련과정 중 parameter 설정 Ex) trainControl ( method = “repeatedcv” number = 10, <- 훈련데이터 fold 갯수 repeat - 5) <- cv 반복 횟수 expand.grid() - factor 조합의 데이터 프레임 생성 Ex) expand.grid (k=1:10) train() Ex) train ( Class ~. , data = method= trContraol prePro...

18049 sym R (23688 sym/60 pcs) 11 img

PCA

23.02.2021

PCA - Iris Species - 범주 나머지 - 연속형 head(iris) ## Sepal.Length Sepal.Width Petal.Length Petal.Width Species ## 1 5.1 3.5 1.4 0.2 setosa ## 2 4.9 3.0 1.4 0.2 setosa ## 3 4.7 3.2 1.3 0.2 setosa ## 4 4.6 3.1 ...

19352 sym R (21496 sym/97 pcs) 32 img

공공데이터

27.03.2021

Citizen In Seoul EDA setwd("C:/Users/Administrator/Desktop/R Analysis") ## 데이터 불러오기 data_2019 = read.csv('Data/SEOUL_PEOPLE_GU_2019.csv', fileEncoding='UTF-8', colClasses=c(`시간대`='character')) data_2020 = read.csv('Data/SEOUL_PEOPLE_GU_2020.csv', fileEncoding='UTF-8', ...

20261 sym R (36095 sym/75 pcs) 11 img

Decisiton Tree_ KNN

27.03.2021

Decision Tree 2.1 Decision Tree 순수도를 더 이상 높일 수 없거나, 말단 노드에 포함된 개체의 수가 사전에 정한 최소값에 도달하였을 때, 노드의 깊이가 사전에 정해놓은 한계에 이를때 재귀적 분할 반복이 일어난다. 지니척도 복원 추출했을때의 동일 범주가 개체가 �...

11529 sym R (10861 sym/34 pcs) 14 img

Cohort Analysis (Sales)

22.03.2021

Introduction Cohort Analysis 는 고객의 retention/chrun(이탈)에 대한 분석이다. 고객의 트렌드에 대한 이해를 높히며, 소비자 타켓을 구축하거나, 의사 결정에 도움을 주는 분석 기법이다. UCI 의 Online Retail Data 를 활용하여 분석을 실시한다. Preprocessing: Features setwd('C:/Users/Admin...

30001 sym R (22392 sym/43 pcs) 9 img

마케팅 예측

17.03.2021

Marketing Evaluation setwd("C:/Users/Administrator/Desktop/R Analysis/Fast Campus") read.csv("bank.csv") -> raw_df str(raw_df) ## 'data.frame': 600 obs. of 20 variables: ## $ age : int 28 68 31 31 77 39 35 41 30 43 ... ## $ job : chr "services" "retired" "services" "entrepreneur" ... ## $ marital : chr "s...

12957 sym R (33358 sym/70 pcs) 11 img

지도학습 SVM & Logistic

17.03.2021

SVM (Support Vector Machine) 1.1 SVM 2개 이상의 집단 분류에 사용되는 기법 이상치 영향이 가장 적음 마진 경계를 최대로하는 서포트 벡터를 찾는 방법 1.2 Hyperplane 데이터와 데이터 사이의 거리 = Margin Margin 에서 가까운 데이터 = Support Vector Margin 과 Support Vector를 이용하�...

15624 sym R (18556 sym/49 pcs) 9 img 1 tbl

Torono Shelter & Sales

03.03.2021

Toronto Shelter clearning : 날짜 변수를 year, month 로 나눔 년도별, occupancy gruop_by(년도), summarise 합계를 구해서 geom_point 연결 월별 capcity 비율 year 세분화 shleter 이름의 중복을 제거해주고, occupancy 와 capacity 의 year 별 합계를 구하고, 나눠서 그 비율을 구함 Waffle Chart - 각...

8551 sym R (4656 sym/6 pcs) 2 img