일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
Tags
- COFIBA
- 클라우드자격증
- 자연어처리
- AWS
- 네트워크
- BERT이해
- 머신러닝 파이프라인
- TFX
- Collaborative Filtering Bandit
- transformer
- llm
- BERT
- 미국석사
- 추천시스템
- HTTP
- RecSys
- aws자격증
- 머신러닝
- 메타버스
- 중국플랫폼
- chatGPT
- MLOps
- 클라우드
- MAB
- nlp
- MSCS
- 플랫폼
- BANDiT
- 언어모델
- docker
Archives
- Today
- Total
목록샘플수 (1)
Julie의 Tech 블로그
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/EziRE/btryyeK5MO2/edK68pNbOyJTMpIL7Ow8v0/img.png)
A/B테스트를 진행하다 보면 한 가지 의문점이 떠오르게 된다 - 실험을 얼마 동안 진행해야할까? 이 질문은 '얼마 만큼의 데이터를 모아야하는가'와 결국 동일한 질문이다. 통계학적으로 접근하자면, 가설검정의 결과는 p-value에 의해 결정된다. 두 집단의 검정통계량 차이가 크면 클수록(p-value가 클수록) 두 집단은 이질적인 집단으로 분류된다. 즉 우리는 샘플 사이즈를 정하기에 앞서 어떤 통계학적 테스트를 이용하여 결과를 볼 것인지 정해야한다. 그 후 최소한의 수준을 정해야한다. 예를 들어 x만큼의 차이가 있는 것으로 밝혀졌을 때, 그 x가 얼마나 큰 것인지를 비교할 수 있는 수준말이다. 그 최소한의 수준(Minimum Detectable Effect, MDE)를 찾아낼 확률을 계산한 뒤, 그 확..
Tech/ML, DL
2022. 4. 5. 18:20