
Meaning of p-value

A comic that humorously depicts the problems with hypothesis testing using p-values The p-value is one of the essential tools in scientific research based on statistics for determining the significance of research results. However, many researchers misuse p-values or intentionally manipulate research results by exploiting the characteristics o...

p-value의 의미

p-value를 이용한 가설 검증 방법의 문제를 재밌게 보여주고 있는 만화 원본 그림: https://imgs.xkcd.com/comics/significant.png p-value는 통계학에 기반한 과학적인 방법으로 연구를 수행하고 그 결과의 유의성을 확인하기 위해 매우 필요한 도구 중 하나이다. 하지만 많은 연구자들이 p-value를 잘못 사용하고 있거나, 어떤 경우 고의적으로 p-value의 특성을 이용해 연구 결과를 부풀리는 경우가 있다. 이번 article에서는 p-value의 의미와 대표적인 오용 사례에 대해 짚어보고자 한다. p-value의 의미 우선은 조금은 딱딱하지만, p-value의...

실패를 기도하는 이론 - 귀무가설과 대립가설

분야를 막론하고 새로운 것을 공부하다보면 맞닥뜨리는 어려움 중 하나는 용어이다. 그래서 용어에 대해 친숙해지고 나서야 비로소 해당 분야에 대해서 공부가 풀려가기 시작하는 경우도 많다. 통계학에서 처음 접하는 용어 중 어려운 것들을 꼽으라면 가설에 관한 것이다. 귀무가설, 대립가설이 대표적인데, 한자 용어라 어려운가 싶어서 영문으로 봐도 전혀 도움이 되지 않는 아주 불친절한 용어들이다 (각각은 null hypothesis, alternative hypothesis로 번역할 수 있다). 필자의 경우 대학원에 들어가서야 통계학을 독학으로 공부했는데 이 용어들에 익숙해지는데까지 1년 넘는 시간이 걸렸던 것 같다. ...

Sample variance is divided by n-1 instead of n

The expected value of sample variance should be equal to population variance. In statistics, estimators are used to estimate population parameters. Representative population parameters include population mean, population variance, and population proportion. Ideally, as the sample size increases, the estimated value calculated from the sample sh...

표본 분산은 n 대신 n-1로 나눈다

표본 분산의 기댓값은 모분산이 되어야 한다. 통계학에서는 어떤 모수를 추정하기 위해 추정량을 사용한다. 대표적인 모수는 모평균, 모분산, 모비율이 있는데, 이상적으로는 표본의 크기가 커질수록 표본으로 부터 계산하여 추정하는 값은 추정하고자 하는 모수와 같아지기를 바란다. 따라서, 이상적인 추정량은 그 추정량의 기대값이 모수와 같은 것이라고 할 수 있다. 대표적인 표본 통계량 중 하나인 표본 분산은 다음과 같이 정의된다. \[s^2 = \frac{1}{n-1}\sum_{k=1}^n{\left(X_k-\bar{X}\right)^2}\] 여기서 n 대신 n-1로 나눠 표본 통계량을 정의한 것은 이렇게 모분산...

Meaning of F-value and Analysis of Variance

Prerequisites To fully understand this post, it is recommended to be familiar with the following content: Meaning of Sampling and Standard Error Methods for comparing multiple sample groups When conducting research or surveys, it is often necessary to compare the means of multiple sample groups. For example, suppose we conduct a survey ...

F-value의 의미와 분산분석

Prerequisites 이 포스트를 잘 이해하기 위해선 아래의 내용에 대해 알고 오시는 것이 좋습니다. 표본과 표준 오차의 의미 여러 표본 집단을 비교하는 방법 연구나 조사를 수행하다보면 여러 표본집단들의 평균을 비교할 필요가 있다. 예를 들어, 두 가지 음식 A, B가 몸무게에 어떤 영향을 주는지 확인하는 조사를 진행한다고 하자. 이 질문에 답하기 위해선 다음과 같이 연구를 진행할 수 있다. 우선 피험자간 몸무게에 큰 차이가 없는 피험자 집단을 모집하고, 해당 집단을 세 그룹으로 나눈 다음 대조군 한 그룹과 음식 A, B만을 먹는 그룹으로 총 세 그룹을 선정해 각각 식이 조절을 시킨다. 그...

