일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 클라우드자격증
- MLOps
- docker
- COFIBA
- 머신러닝 파이프라인
- BERT
- HTTP
- 클라우드
- chatGPT
- BANDiT
- Collaborative Filtering Bandit
- 메타버스
- 자연어처리
- 머신러닝
- aws자격증
- llm
- 언어모델
- transformer
- MSCS
- MAB
- nlp
- 미국석사
- TFX
- 중국플랫폼
- 추천시스템
- RecSys
- AWS
- 플랫폼
- BERT이해
- 네트워크
Archives
- Today
- Total
목록모델링 (1)
Julie의 Tech 블로그
데이터 경진대회에서 유용하게 써먹을 수 있는 EDA 방법들
이번 글에는 지금까지 경진대회에 참가해보면서 이리저리 리서치하고 써봤던 EDA 테크닉을 몇 개 정리하려고 한다. EDA의 결과에 따라 어떤 feature를 사용할 것인지, 어떤 종류의 모델이 적합한지에 대해 파악할 수 있기 때문에 EDA는 무척 중요한 프로세스다. 필자는 대부분 예측(Prediction) 문제를 다루는 대회를 경험해봐서, 예측 모델을 빌딩하는 것을 베이스에 두고 글을 써내려갈 것이다. 여느 대회에 참여하게 되면 가장 먼저 학습데이터를 다운받는 것부터 시작한다. 데이터 명세서까지 제공해주는 친절한 대회라면, 그 명세서를 옆에 두고 데이터를 개괄적으로 둘러보기 시작할 것이다. 이를 바탕으로 가장 먼저 시도해보는 것들은 기본적인 EDA이다. 1. 데이터 이해 - 데이터 사이즈, 스키마 이해..
Tech/ML, DL
2021. 8. 22. 21:48