5개의 나무에 대한 수령과 둘레를 기록한 아래의 데이터에 대한 tidyr 패키지의gather()와 spread()를 테스트하자. Orange 데이터-------------> head(Orange) Grouped Data: circumference ~ age | Tree Tree age circumference 1 1 118 30 2 1 484 58 3 1 664 87 4 1 1004 115 5 1 1231 120 6 1 1372 142 ------------ age와 circumference 컬럼에 대한 gather() 수행 ------------> long_Orange % + gather(key=측정, value=값, -Tree) > head(long_Orange) Tree 측정 값 1 1 age 11..
Q. 샘플 분산은 ( 표본 값과 표본 평균의 차의 제곱값 ) 을 샘플의 갯수 n이 아닌 (n-1) 로 나누어 구한다. 다음의 조건에서 n 으로 나눈 경우와 (n-1)로 나눈 경우를 모분산과 비교하여 그래프를 그리시오. (모집단 데이터 갯수 N ) = 100,000 (모집단 분포) = 1 ~ 10 까지 정수의 균등 분포 (표본 집단의 데이터 갯수 n ) = 1000 (표본 집단의 수 num_samples ) = 500 표본 집단의 수의 변화 ( 1 ~ 500 )에 따른 2가지 방법에 의해 구한 분산과 모분산을 그래프로 그리시오. A. ############################################################################################## 샘플..
Q. 몬테카를로 시뮬레이션을 사용하여 몬티홀 문제를 푸시오 ( 참고 : 몬티홀 문제 ) 몬티 홀이라는 미국/캐나다 TV 프로그램 사회자가 진행하던 미국 오락 프로그램 《Let's Make a Deal》에서 유래한 확률 문제. 너무 유명해져서 구글에 몬티 홀이라고 검색해도 사람 대신 문제가 먼저 나올 정도다. 최초로 수학 문제로서 제시된 것은 1975년의 일이고, 메릴린 보스 사반트가 1990년에 《퍼레이드》라는 잡지의 독자의 질문을 해결해주는 칼럼 '사반트에게 물어보세요'에서 이 문제를 다루면서 유명해졌다. 아래의 원문은 해당 칼럼에 실린 문제를 그대로 가져온 것이며, 상품의 종류 등의 디테일은 조금씩 바뀐다. Suppose you’re on a game show, and you’re given the ..