일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 네트워크
- llm
- 미국석사
- transformer
- 클라우드자격증
- Collaborative Filtering Bandit
- COFIBA
- 메타버스
- 중국플랫폼
- 플랫폼
- MAB
- chatGPT
- BERT
- 클라우드
- 머신러닝 파이프라인
- aws자격증
- TFX
- 언어모델
- MSCS
- HTTP
- 추천시스템
- docker
- AWS
- nlp
- RecSys
- MLOps
- 자연어처리
- BERT이해
- BANDiT
- 머신러닝
- Today
- Total
목록MAB (9)
Julie의 Tech 블로그
Context Adaptation for Smart Recommender Systems https://www.researchgate.net/publication/284218062_Context_Adaptation_for_Smart_Recommender_Systems Introduction 이번에 리뷰할 논문은 지금껏 살펴봤던 알고리즘과 유사하게 context를 반영하는 Bandit 알고리즘이다. 본 논문은 추천 시스템에 있어 Context가 매우 중요하다는 논조로 시작된다. 훌륭한 알고리즘만으로 뛰어난 성과(CTR혹은 전환율)를 이끌어내긴 어렵다고 하며, 사용자의 context 요인도 알고리즘에 반영되어야한다고 한다. 주로 이커머스 시장에서의 추천 시스템에 초점을 맞춰두고 있으며, 아래와 같이 두 가지에..
Introduction 여러 이해 관계자들이 존재하는 플랫폼의 추천 시스템은 하나 이상의 최적화 문제를 풀어야한다. 흔히 최적화를 할 때 극대화 혹은 최소화하고자 하는 '목적 함수(objective)'가 있는데, 이 목적 함수가 여럿이라는 것이다. 여기서 목적함수의 개념은 유저의 행동 metric (ex) 클릭, 스트리밍, 체류시간 등), 혹은 플랫폼의 프로모션과 같은 자체 목적 등이 포함된다. 이러한 여러 가지의 metric을 동시에 만족시키기란 현실적으로 힘들다. 따라서 본 논문은 다중 이해관계자가 존재하는 플랫폼 상에서의 다중 목적 최적화 문제를 contextual bandit으로 해결하고자 한다. 일반적으로 다중 목적 최적화 (multi-objective optimization) 을 해결하는 데에..
지난번 논문 리뷰에 이어 stochastic bandit 모델을 한 번 더 살펴볼 것이다. 이번 논문은 좀 더 간단하다. A contextual-bandit Algorithm for Mobile Context-Aware Recommender System https://www.researchgate.net/publication/235683567_A_Contextual_Bandit_Algorithm_for_Mobile_Context-Aware_Recommender_System Introduction 본 논문은 moblie context-aware recommender system, 줄여서 CARS 추천시스템 모델이다. 요즈음 사람들은 휴대폰에 많은 콘텐츠를 저장하고 사용하는데, 그 저장소에는 빈번히 새로운 ..
Exploitation and Exploration in a Performance based Contextual Advertising System http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.297.8373&rep=rep1&type=pdf Introduction 온라인 광고 시장은 굉장히 역동적이다. 실시간으로 어떤 광고를 송출해야할지 결정해야하기 때문이다. 광고는 광고주가 인벤토리에 따라 일정 클릭 수만큼 광고비를 지불한다. (CPC 방식이라고 부른다) * CPC : cost-per-click 이 때 한정된 인벤토리 내 최대의 성과를 낼 수 있는 광고를 선택해야만 한다. 기존에 집행해본 경험이 있는 광고와, 그렇지 않은 신규 광고 사이에서 어떤 ..
이전 글에서는 COFIBA모델의 pseudo code와 각 구간별 로직에 대해 설명을 담았었다. 이번 글에서는 해당 모델이 세 개 테스트 데이터 셋에서 어떤 성과를 내었으며, 어떤 결론을 내릴 수 있는지 다룰 것이다. 수식 편집기 한계로, 글에서 기울임체로 작성하는 변수는 각각 아래와 같이 이해하면 된다. 1) 야후 뉴스 추천 데이터셋 - 2주간 야후 내 'Today Module' 섹션에 유입된 3000만 트래픽 기록 중 random하게 셀렉 - 뉴스 추천과 방문자가 모두 random하게 꾸려짐 - 유저 벡터 > it (136개 feature dimension), 뉴스 컨텐츠 > Cit, 클릭 여부 > at 2) Telefonica 광고 데이터셋 - Telefonica에서 운영하는 웹사이트 내 광고 클릭..
지난번에는 CF와 stochastic MAB를 합친 COFIBA모델을 간단히 소개했다. 이번에는 그 모델의 pseudo code를 보면서 로직을 정확히 이해해보고자 한다. 우선 간략히 모델의 알고리즘 로직 순서를 요약하면 아래와 같다. 1. t번째 라운드에서 모델은 특정 유저에게 추천 가능한 아이템 리스트 중 가장 기대보상이 큰 아이템을 선택 2. 선택 결과에 따라 유저로부터 실제 보상 결과를 받음 3. 실제 보상 결과에 따라 모델이 업데이트됨 3-1. 모델 파라미터 업데이트 3-2. 유저 클러스터, 아이템 클러스터 순으로 업데이트 4. 1-3 반복 좀 더 자세하게 알아보자. Intial Setting : input, output 각 용어별 정의는 아래와 같다. U는 유저 그룹, I는 콘텐츠 그룹..