Publications by Kong, Seokkyu
이항분포 simulation
version: 1.1 R 이항분포 정리 항아리에 흰공 2개와 검은공 3개가 있다. 이중 흰공을 선택할 확률은 얼마인가? 물론, 전체 가능한 경우의 수는 5가지에서 흰공은 2개니까 P(X = 흰공) = 2/5 = 0.4가 된다. 자, 그럼 여기서 한 가지 더 생각해 보자. 만약 7번 시도해서 그 중 한 ...
926 sym R (1503 sym/13 pcs) 1 img
신뢰구간 시뮬레이션
요약 주의: 본인 블로그에 올린 내용들은 통계 공부를 정리한 내용이며, 정리 과정 중 틀린 내용들이 포함될 수 있습니다. 혹시 제가 잘못 알고 있는 내용을 가르쳐 주시는 것은 언제든 환영합니다. 오늘은 정규분포를 이용한 신뢰구간 구하기 문제를 정리한다. (참...
1897 sym R (1025 sym/12 pcs)
R, Odds graph 그리기
지수함수 지수함수 그래프를 그려본다. y 값은 0보다 항상 크다. x <- seq(-4, 4, 0.01) y <- exp(x) plot(x, y, type="l") abline(h = 0, v = 0) # x, y축 그리기 로그함수 로그함수 그래프를 그려본다. x <- seq(-4, 4, 0.01) y <- log(x) ## Warning in log(x): NaN이 생성되었습니다 plot(x, y, type="l") abl...
903 sym R (505 sym/7 pcs) 5 img
ROC curve 이해하기
Summary ROC curve는 Receiver Operating Characteristic curve 의 약자이다. 이것은 여러 모델의 성능을 평가하기 위해 민감도 sensitivity 및 특이도 specificity 로 이루어진 그래프이고, 이 내용을 예제를 통해서 이해하고 ROC curve 를 그린다. 참고도서: R을 활용한 기계학습, 브레드 란�...
1963 sym R (3937 sym/10 pcs) 4 img
푸아송 분포 Poisson distribution
이항분포를 다시 한번 생각해보자. 볼링을 치는데 한 번 칠때 스트라이크 될 확률이 0.1 이라고 하자. 만약 100번을 쳤을 경우 12번 스트라이크될 확률은? 이 경우 X ~ B(n, p)를 따른다. 즉, X ~ B(100, 0.1)이고 기대치 E(X) = n * p = 100 * 0.1 = 10 이고 분산 Var(X) = n * p * q = 100 * 0....
1153 sym R (890 sym/9 pcs) 1 img
95% 신뢰구간 구하기
Summary 주의사항: 본 블로그 내용은 통계 학습차원에서 정리한 내용이며, 틀린 내용이 포함될 수 있습니다. 혹시 틀린 내용이 있다면 알려주세요. 감사합니다. 95% 신뢰구간의 내용을 정리한다. 참고한 책은 다음과 같다. Head First Statistics 세상에서 가장 쉬운 통계학 ...
2201 sym R (3687 sym/18 pcs) 2 img
Negative Binomial Distribution Simulation
Summary 음이항분포는 기하분포의 일반화이다. 기하분포가 첫번째 성공전의 실패횟수에 관심이 있다면, 음이항분포는 r번째 성공까지 실패한 횟수에 관심이 있다. 예제로, 축구선수가 프리킥 성공율이 20% 이다. 이 선수가 5번 성공까지 실패한 횟수를 simulation 결과와...
243 sym R (2032 sym/7 pcs) 1 img
지수분포의 기대값 simulation
Summary 버스가 1 시간에 평균적으로 6대가 온다. 이때 20분 이상 오는 버스들에 대한 평균 기대시간은 얼마일까? 이 문제를 Exponential distribution의 Expectation value 으로 simulation 을 통해 알아보자. 수식으로 보면, \(E(X | X > a) = a + E(X - a | X > a) = a + 1/ \lambda = 20/60 + 1/6 = 0.5 h\)...
985 sym R (1132 sym/7 pcs) 1 img
Coupon Collector 문제
Summary 쿠폰 수집가 문제를 simulation 해본다. 쿠폰 수집가 문제는, n 개의 서로 다른 쿠폰이 있을 때, n 개 모두 획득할 때까지 평균적으로 몇 번의 시도를 해야 할까? 라는 것이다. 예를 들어, 10개의 캐릭터가 있고, 과자 봉지 당 하나의 캐릭터가 있다. 나는 평균적으�...
260 sym R (1478 sym/9 pcs) 1 img
조건부 기대값 simulation
Summary 포아송 분포를 따르는 서로 독립인 확률변수 X, Y 가 있다. \(X, Y \sim i.i.d. Pois(\lambda)\) 이때 E(X|X+Y) 는 어떻게 될까? \(T = X+Y,\) \(E(X | X+Y) + E(Y | X+Y) = E(X + Y|X+Y) = X+Y\) => \(E(X|X+Y) = (X+Y)/2 = T/2\) 아래 내용은 simulation 을 통해서 위 내용을 확인한다. library(dplyr) ## Warning:...
245 sym R (1160 sym/7 pcs) 1 img