일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 머신러닝 파이프라인
- COFIBA
- transformer
- MLOps
- BANDiT
- llm
- docker
- aws자격증
- TFX
- 중국플랫폼
- 머신러닝
- MAB
- 미국석사
- Collaborative Filtering Bandit
- 네트워크
- 언어모델
- 클라우드자격증
- chatGPT
- RecSys
- 클라우드
- BERT
- MSCS
- AWS
- 자연어처리
- BERT이해
- HTTP
- nlp
- 플랫폼
- 추천시스템
- 메타버스
- Today
- Total
목록COFIBA (3)
Julie의 Tech 블로그
이전 글에서는 COFIBA모델의 pseudo code와 각 구간별 로직에 대해 설명을 담았었다. 이번 글에서는 해당 모델이 세 개 테스트 데이터 셋에서 어떤 성과를 내었으며, 어떤 결론을 내릴 수 있는지 다룰 것이다. 수식 편집기 한계로, 글에서 기울임체로 작성하는 변수는 각각 아래와 같이 이해하면 된다. 1) 야후 뉴스 추천 데이터셋 - 2주간 야후 내 'Today Module' 섹션에 유입된 3000만 트래픽 기록 중 random하게 셀렉 - 뉴스 추천과 방문자가 모두 random하게 꾸려짐 - 유저 벡터 > it (136개 feature dimension), 뉴스 컨텐츠 > Cit, 클릭 여부 > at 2) Telefonica 광고 데이터셋 - Telefonica에서 운영하는 웹사이트 내 광고 클릭..
지난번에는 CF와 stochastic MAB를 합친 COFIBA모델을 간단히 소개했다. 이번에는 그 모델의 pseudo code를 보면서 로직을 정확히 이해해보고자 한다. 우선 간략히 모델의 알고리즘 로직 순서를 요약하면 아래와 같다. 1. t번째 라운드에서 모델은 특정 유저에게 추천 가능한 아이템 리스트 중 가장 기대보상이 큰 아이템을 선택 2. 선택 결과에 따라 유저로부터 실제 보상 결과를 받음 3. 실제 보상 결과에 따라 모델이 업데이트됨 3-1. 모델 파라미터 업데이트 3-2. 유저 클러스터, 아이템 클러스터 순으로 업데이트 4. 1-3 반복 좀 더 자세하게 알아보자. Intial Setting : input, output 각 용어별 정의는 아래와 같다. U는 유저 그룹, I는 콘텐츠 그룹..
전통적인 CF 기반 추천 방식은 유저와 아이템 셋이 고정되어있다. 하지만 일반적인 추천 시스템에서는 유저와 아이템 풀이 점점 확장된다. 서비스에서는 신규 유저가 인입되기도 하고, 기존 유저가 이탈하기도 하며, 아이템 셋도 변한다. 또한 가장 중요한 것은 유저의 선호가 지속적으로 변한다는 것이다. 이에 따라 논문은 Contextual Bandit을 CF알고리즘의 특성을 녹여 재구성한 알고리즘을 제안했다. Collaborative filtering bandits SIGIR, 2016 : https://arxiv.org/pdf/1502.03473.pdf 논문에서는 Bandit이 지속적으로 변하는 유저의 선호를 맞춘 추천을 해주기 적합한 알고리즘이라고 소개한다. 하지만 이 알고리즘은 비슷한 아이템이나 유저 간 ..