Publications by Kong, Seokkyu
Sum of Expo
R Markdown 본 내용은 STAT-110 강의 24번의 일부 내용을 simulation 합니다. 1시간에 평균 5통의 이메일을 받는 포아송 프로세스를 생각해보자. Nt 를 시간 t 동안 받은 이메일의 수라고 하면 \(Nt \sim Pois(\lambda t)\) 를 따른다. => \(Nt \sim Pois(5)\) 각 메일간의 도착 대기 시간은 지...
399 sym R (876 sym/9 pcs) 3 img
Order Statistics simulation
Summary 본 내용은 STAT-110 강의 25번의 일부 내용을 R 코드로 simulation 합니다. 자세한 내용은 해당 강의를 참조하세요. \(U1, U2, ,,, Un \sim Unif(0, 1)\) 을 따른다고 하자. 그리고 이 확률변수값을 가장 작은 것에서 가장 큰 것 순서로 정렬을 한다. 그럼, 이중 5번째 위치한 확...
641 sym R (750 sym/5 pcs) 1 img
조건부 기대값 - 동전던지기
Summary 동전을 던져서, 앞면이 2개 연달아 나오는 경우와 앞면, 뒷면이 나오는 경우에 대한 기대값을 simulation 해보자. W_HT: HT(앞면, 뒷면)을 처음으로 얻기 까지 많은 동전을 던졌을텐데, 그 던진 횟수를 나타내는 확률변수 W_HH: HH(앞면, 앞면)을 처음으로 얻기 까지 �...
270 sym R (783 sym/6 pcs) 2 img
MCMC-Zipf 분포 시뮬레이션
Summary 본 내용은 Introduction to Probability-2nd, Blitzstein의 538-539 페이지 내용을 정리했습니다. \(M \ge 2\) 이며 정수라고 하자. 확률 변수 X 는 파라미터 \(a \gt 0\) 를 갖는 Zipf 분포라고 하면, PMF는 아래와 같다. \(P(X = k) = {1/k^a \over \sum_{j=1}^{M}(1/j^a)}\) , for k=1,2,…,M 이 분포는 �...
769 sym R (1557 sym/5 pcs) 3 img
MCMC 간단 예제
Summary MCMC(Markov chain Monte Carlo) 는 샘플링 방법이다. 여기서는 계산가능한 함수 f(x) 를 타겟분포로 주어졌을 때 이 함수로부터 샘플링하는 간단한 예제를 작성해본다. 자세한 내용은 아래 참고 사이트를 참조한다. 참고 사이트: https://www.secmem.org/blog/2019/01/11/mcmc/ https...
431 sym R (1475 sym/5 pcs) 3 img
Markov Chain 응용
Summary 본 내용은 STAT-110 강의 31 번의 일부 내용과 선형대수학(길버트 스트랭교수님) 교재의 일부 내용을 바탕으로 마코프 체인의 응용 예제를 작성합니다. 웹사이트 A, B, C 가 있다. 이 웹사이트의 10년 후 사용자수 예측과 50년 후 사용자수 예측을 마코프 체인과 전�...
2083 sym R (3712 sym/34 pcs) 2 img
카이제곱분포 요약
Summary 본 내용은 STAT-110 강의 30번의 일부 내용 정리입니다. 자세한 내용은 해당 강의를 참고하세요. 카이제곱분포는 평균이 0, 분산이 1(즉 표준편차도 1)의 정규 분포를 따르는 x라는 변수를 생각했을 때 이 변수의 제곱을 전부 더한 것의 분포다. \(\chi^2(1), \chi^2(3)\) ...
817 sym R (1406 sym/13 pcs) 8 img
2번 부러뜨린 막대이 평균 길이
Summary 막대 길이가 1 이다. 이것을 2번 연속으로 부러뜨렸을 때, 남은 한 조각의 평균 길이는? \(E(E(Y|X)) = E(Y)\) set.seed(1234) num_trials <- 10000 # simulation 시도 횟수 x <- runif(num_trials, 0, 1) # 0~1 까지 unif 랜덤값을 생성한다. # 0 ~ x 길이 사이의 unif 랜덤값을 생성하고 그 값을...
91 sym R (383 sym/3 pcs) 1 img
상관비 예제
Summary 연령별 선호하는 패션 브랜드 설문자료를 통해서 상관비 개념을 검토한다.[1] 또한 STAT-110[3] 에서 배운 전체확률의 법칙[2]을 통해서 구한 값과 비교한다. 상관비는 수량데이터와 카테고리 데이터 비교할 때 사용한다. 여기서는 ‘연령별’ ‘선호하는 패션 �...
874 sym R (2641 sym/19 pcs) 2 img 1 tbl
95% 신뢰구간 simulation
Summary Last Updated: 2022-02-27 주의사항: 본 블로그 내용은 통계 학습차원에서 정리한 내용이며, 틀린 내용이 포함될 수 있습니다. 혹시 틀린 내용이 있다면 알려주세요. 감사합니다. 표본을 이용해서 모평균(모집단 평균값)의 95% 신뢰구간의 내용을 정리한다. ([1], p530) ...
1740 sym R (3285 sym/16 pcs) 2 img