일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 메타버스
- transformer
- llm
- BERT이해
- nlp
- 머신러닝
- 클라우드
- 추천시스템
- Collaborative Filtering Bandit
- 중국플랫폼
- 언어모델
- chatGPT
- AWS
- RecSys
- BANDiT
- COFIBA
- 플랫폼
- 네트워크
- MLOps
- TFX
- docker
- 미국석사
- BERT
- 머신러닝 파이프라인
- MAB
- HTTP
- 자연어처리
- aws자격증
- 클라우드자격증
- MSCS
Archives
- Today
- Total
목록표본수 (1)
Julie의 Tech 블로그
A/B Test in Data Science - (3) 샘플 크기는 얼마나 해야할까? 검정력 분석(Power Analysis)
A/B테스트를 진행하다 보면 한 가지 의문점이 떠오르게 된다 - 실험을 얼마 동안 진행해야할까? 이 질문은 '얼마 만큼의 데이터를 모아야하는가'와 결국 동일한 질문이다. 통계학적으로 접근하자면, 가설검정의 결과는 p-value에 의해 결정된다. 두 집단의 검정통계량 차이가 크면 클수록(p-value가 클수록) 두 집단은 이질적인 집단으로 분류된다. 즉 우리는 샘플 사이즈를 정하기에 앞서 어떤 통계학적 테스트를 이용하여 결과를 볼 것인지 정해야한다. 그 후 최소한의 수준을 정해야한다. 예를 들어 x만큼의 차이가 있는 것으로 밝혀졌을 때, 그 x가 얼마나 큰 것인지를 비교할 수 있는 수준말이다. 그 최소한의 수준(Minimum Detectable Effect, MDE)를 찾아낼 확률을 계산한 뒤, 그 확..
Tech/ML, DL
2022. 4. 5. 18:20