일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- MAB
- transformer
- nlp
- 미국석사
- aws자격증
- COFIBA
- AWS
- HTTP
- 메타버스
- Collaborative Filtering Bandit
- BERT
- BERT이해
- 추천시스템
- MSCS
- 머신러닝
- llm
- docker
- 클라우드
- 머신러닝 파이프라인
- chatGPT
- BANDiT
- TFX
- 자연어처리
- 네트워크
- 플랫폼
- MLOps
- 클라우드자격증
- 중국플랫폼
- 언어모델
- RecSys
Archives
- Today
- Total
목록데이터분석 (1)
Julie의 Tech 블로그
데이터 경진대회에서 유용하게 써먹을 수 있는 EDA 방법들
이번 글에는 지금까지 경진대회에 참가해보면서 이리저리 리서치하고 써봤던 EDA 테크닉을 몇 개 정리하려고 한다. EDA의 결과에 따라 어떤 feature를 사용할 것인지, 어떤 종류의 모델이 적합한지에 대해 파악할 수 있기 때문에 EDA는 무척 중요한 프로세스다. 필자는 대부분 예측(Prediction) 문제를 다루는 대회를 경험해봐서, 예측 모델을 빌딩하는 것을 베이스에 두고 글을 써내려갈 것이다. 여느 대회에 참여하게 되면 가장 먼저 학습데이터를 다운받는 것부터 시작한다. 데이터 명세서까지 제공해주는 친절한 대회라면, 그 명세서를 옆에 두고 데이터를 개괄적으로 둘러보기 시작할 것이다. 이를 바탕으로 가장 먼저 시도해보는 것들은 기본적인 EDA이다. 1. 데이터 이해 - 데이터 사이즈, 스키마 이해..
Tech/ML, DL
2021. 8. 22. 21:48