일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- chatGPT
- 네트워크
- Collaborative Filtering Bandit
- BERT이해
- nlp
- llm
- HTTP
- RecSys
- 추천시스템
- transformer
- docker
- 자연어처리
- COFIBA
- 중국플랫폼
- 언어모델
- 미국석사
- aws자격증
- 머신러닝
- AWS
- 머신러닝 파이프라인
- BANDiT
- MSCS
- MAB
- 플랫폼
- TFX
- 클라우드
- MLOps
- 클라우드자격증
- 메타버스
- BERT
Archives
- Today
- Total
목록Data Ingestion (1)
Julie의 Tech 블로그
ML Ops, 머신러닝 파이프라인 설계 - (3) Data Ingestion
이번 글부터는 머신러닝 파이프라인 단계별로 좀 더 상세하게 살펴볼 것이다. 일단 가장 첫 단추라고 할 수 있는 데이터 Ingestion 부터 알아보도록 하자. TFX 는 데이터를 파일 혹은 어느 서비스 형태로 파이프라인에 삽입할 수 있도록 Component를 제공한다. 그 중 하나가 TFRecord , 즉 사이즈가 큰 데이터를 스트리밍하는 용도로 최적화된 경량화된 format 이다. TFRecord 파일은 여러개의 tf.Example 레코드로 구성되어 있는데, 각 레코드는 하나 이상의 feature 로 구성되어있다. feature는 데이터에서 컬럼에 대응하는 단위로 생각하면 된다. 이 레코드들이 바이너리 형식의 TFRecord로 저장되게 된다. 따라서 큰 데이터를 write하거나 다운로드할 때 최적화..
Tech/MLOps
2021. 9. 7. 23:19