일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- aws자격증
- RecSys
- chatGPT
- docker
- Collaborative Filtering Bandit
- 추천시스템
- 머신러닝
- 클라우드
- AWS
- 메타버스
- MAB
- BANDiT
- 머신러닝 파이프라인
- COFIBA
- transformer
- llm
- TFX
- 네트워크
- BERT이해
- 플랫폼
- 중국플랫폼
- 클라우드자격증
- 미국석사
- MSCS
- 자연어처리
- nlp
- BERT
- MLOps
- 언어모델
- HTTP
- Today
- Total
목록F분포 (2)
Julie의 Tech 블로그
이번 글에서는 지난번 순열검정에 이어 여러 그룹간 차이의 유의미성을 따질 때 사용할 수 있는 모델인 ANOVA를 다룰 것이다. ANOVA는 3개 이상의 집단일 때 적합한 테스트로 알려져있다. ANOVA/분산분석은 ANalysis Of VAriance의 약자이다. 본격적으로 ANOVA에 대해 알아보기 전에 제약사항을 하나 짚고 넘어가자. ANOVA는 독립적인 표본에 적용할 수 있는 기법이다. 즉 표본이 서로 의존적이라면 테스트에 적합하지 않다. ANOVA는 다음과 같은 절차로 이루어진다 : 1. 데이터를 하나의 박스에 모두 넣는다. 2. 1에서 서로 무작위로 섞은 뒤 각각 본래 그룹사이즈대로 나눈다. (ex. 5그룹 2사이즈씩이었다면 2에서 동일하게 다시 배분) 3. 각 그룹의 통계량을 계산한다. (ex..
이번 글은 확률 분포에 대해 간단하게 정리해보려고 한다. 수학적으로 접근하기 보단 분포들이 실제로 어떤 목적을 지니고, 어떤 경우에 활용되는지 등 실용적인 측면에서 정리하였다. 우리가 확률 분포라고 함은 아래와 같이 분류할 수 있다. 우리는 여기서 연속확률분포에 대해 간단하게 살펴볼 것이다. 그 중에서도 정규분포, 카이제곱 분포, t분포에 대해 알아보자. 분포는 중요한 두 개의 통계량을 가지고 있다. 중심 위치(평균)과 퍼짐 정도(분산)이다. 모집단에 대한 분포를 알고 싶을 때 우리가 전수조사를 통해 데이터를 수집한 후 모집단의 통계량을 구할 수도 있다. 하지만 이 방법은 비현실적이고 불가능하기 때문에 우리는 늘 '표본(Sample)'을 통해 모집단에 대해 추정하곤 한다. 실례로는 대한민국..