일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 플랫폼
- MSCS
- nlp
- AWS
- 중국플랫폼
- transformer
- 미국석사
- 클라우드
- MLOps
- Collaborative Filtering Bandit
- 머신러닝 파이프라인
- HTTP
- docker
- TFX
- 자연어처리
- COFIBA
- aws자격증
- 머신러닝
- 네트워크
- 언어모델
- 메타버스
- BERT
- BERT이해
- 추천시스템
- 클라우드자격증
- llm
- BANDiT
- chatGPT
- RecSys
- MAB
Archives
- Today
- Total
목록data sampling (1)
Julie의 Tech 블로그
Data Sampling에 관하여 - (2) Bootstrap, 부트스트랩
이전 글에서는 데이터 샘플링에 대한 개념과 랜덤샘플링, 편향(Bias)에 대해 간단하게 살펴보았다. 이번 글은 Bootstrap 이라는 개념에 대해 알아보자. 통계량의 표본 분포에 대해 측정하려고할 때 가장 쉽고도 효과적인 방법은, 반복해서 샘플링을 추출해내는 것이다. 이 때 복원 추출을 허용한다. 우리가 A라는 모집단에서 A', A'', A'''..., 로 표본을 계속해서 뽑고 그 표본의 통계량을 반복해서 계산한다고 생각해보자. 표본을 추출하는 횟수를 늘려갈수록 이 통계량들의 평균은 A 모집단의 통계량 평균과 유사해질 것이다. 이 과정을 Bootstrap이라고 부른다. 부트스트랩은 표준분포와 같은 일반적인 가정을 포함하여 어떠한 조건도 요구하지 않아 간단하다. Bootstrap 과정을 간단하게 ..
Tech/ML, DL
2022. 4. 2. 13:39