728x90
T-Test, ANOVA
- T-test, ANOVA 는 통계 기반 데이터 분석의 기본 방법론 중 하나
- 집단 내 혹은 집단 간의 평균값 차이가 통계적으로 유의미한 것인지 알아내는 방법
- 예) 쇼핑몰의 지역별 객단가를 분석한다면
- A지역의 고객별 평균 매출: 67,000원
- B지역의 고객별 평균 매출: 68,500원
- 이 때, 1500원의 차이가 우연적인 차이인지, 통계적으로 유의미한 차이인지를 알아보기 위해 사용
- 예) 쇼핑몰의 지역별 객단가를 분석한다면
- T-test는 두 집단 간의 평균 차이를 분석할 때 사용
- ANOVA는 두 집단 이상일 경우에 사용
- T-test는 분석하고자 하는 변수가 양적 변수이며, 정규 분포이며, 등분산성이라는 조건이 충족되어야 함
- 평균의 차이가 클수록, 표본의 수가 많을수록 귀무가설이 기각될 가능성이 커지고, 관측치들의 값 간의 표준편차가 크면 평균의 차이가 불분명해지고 귀무가설이 채택될 가능성이 커짐
- 각 고객들의 마케팅 프로그램 전과 후의 매출 차이가 들쑥날쑥하면 매출 평균 차이가 우연에 의한 것일 확률이 높다고 판단
728x90
'07_Data_Analysis' 카테고리의 다른 글
14_ANOVA(ANalysis Of VAriance) (2) | 2025.03.19 |
---|---|
13_T-Test (0) | 2025.03.19 |
11_탐색적 데이터 분석_국가별 음주 데이터 분석 (1) | 2025.03.19 |
10_탐색적 데이터 분석 (0) | 2025.03.19 |
09_데이터 분석의 이해 (4) | 2025.03.17 |