일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 추천시스템
- docker
- Collaborative Filtering Bandit
- nlp
- 클라우드자격증
- HTTP
- COFIBA
- 네트워크
- RecSys
- AWS
- 머신러닝 파이프라인
- BERT
- 중국플랫폼
- MAB
- 자연어처리
- 미국석사
- 플랫폼
- BANDiT
- 메타버스
- 머신러닝
- 클라우드
- chatGPT
- llm
- BERT이해
- MSCS
- MLOps
- TFX
- 언어모델
- transformer
- aws자격증
- Today
- Total
목록BANDiT (6)
Julie의 Tech 블로그
Context Adaptation for Smart Recommender Systems https://www.researchgate.net/publication/284218062_Context_Adaptation_for_Smart_Recommender_Systems Introduction 이번에 리뷰할 논문은 지금껏 살펴봤던 알고리즘과 유사하게 context를 반영하는 Bandit 알고리즘이다. 본 논문은 추천 시스템에 있어 Context가 매우 중요하다는 논조로 시작된다. 훌륭한 알고리즘만으로 뛰어난 성과(CTR혹은 전환율)를 이끌어내긴 어렵다고 하며, 사용자의 context 요인도 알고리즘에 반영되어야한다고 한다. 주로 이커머스 시장에서의 추천 시스템에 초점을 맞춰두고 있으며, 아래와 같이 두 가지에..
Exploitation and Exploration in a Performance based Contextual Advertising System http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.297.8373&rep=rep1&type=pdf Introduction 온라인 광고 시장은 굉장히 역동적이다. 실시간으로 어떤 광고를 송출해야할지 결정해야하기 때문이다. 광고는 광고주가 인벤토리에 따라 일정 클릭 수만큼 광고비를 지불한다. (CPC 방식이라고 부른다) * CPC : cost-per-click 이 때 한정된 인벤토리 내 최대의 성과를 낼 수 있는 광고를 선택해야만 한다. 기존에 집행해본 경험이 있는 광고와, 그렇지 않은 신규 광고 사이에서 어떤 ..
이전 글에서는 COFIBA모델의 pseudo code와 각 구간별 로직에 대해 설명을 담았었다. 이번 글에서는 해당 모델이 세 개 테스트 데이터 셋에서 어떤 성과를 내었으며, 어떤 결론을 내릴 수 있는지 다룰 것이다. 수식 편집기 한계로, 글에서 기울임체로 작성하는 변수는 각각 아래와 같이 이해하면 된다. 1) 야후 뉴스 추천 데이터셋 - 2주간 야후 내 'Today Module' 섹션에 유입된 3000만 트래픽 기록 중 random하게 셀렉 - 뉴스 추천과 방문자가 모두 random하게 꾸려짐 - 유저 벡터 > it (136개 feature dimension), 뉴스 컨텐츠 > Cit, 클릭 여부 > at 2) Telefonica 광고 데이터셋 - Telefonica에서 운영하는 웹사이트 내 광고 클릭..
지난번에는 CF와 stochastic MAB를 합친 COFIBA모델을 간단히 소개했다. 이번에는 그 모델의 pseudo code를 보면서 로직을 정확히 이해해보고자 한다. 우선 간략히 모델의 알고리즘 로직 순서를 요약하면 아래와 같다. 1. t번째 라운드에서 모델은 특정 유저에게 추천 가능한 아이템 리스트 중 가장 기대보상이 큰 아이템을 선택 2. 선택 결과에 따라 유저로부터 실제 보상 결과를 받음 3. 실제 보상 결과에 따라 모델이 업데이트됨 3-1. 모델 파라미터 업데이트 3-2. 유저 클러스터, 아이템 클러스터 순으로 업데이트 4. 1-3 반복 좀 더 자세하게 알아보자. Intial Setting : input, output 각 용어별 정의는 아래와 같다. U는 유저 그룹, I는 콘텐츠 그룹..
넷플릭스에서는 영상 이미지, 즉 artwork를 어떤 것을 선택할지에 대해 추천 로직을 적용하고 있다. 이미지는 대표성과 정보성, 매력, 차별성을 지니고 있어야하는데, 이 모두 개인적인 성향에 영향을 받을 수 밖에 없다. 사람들은 대개 장르 혹은 캐스팅에 대한 선호를 지니는데, 이 선호가 이미지로 반영될 수 있다. 행과 열로 구성된 바둑판 화면을 inventory라고 치면, 각 구좌에 배치할 오더링과, 구좌에 넣을 광고 이미지는 어떤 것을 선택해야할까? 이 모든 것은 추천 알고리즘으로 돌아간다. 전통적인 추천 방식은 단연 Collaborative Filtering 이다. 하지만 이로 부족하다. CF는 현재 운영중인 상품 pool 내에서만 유사한 상품 추천이 가능하고, 새로이 탐색할 수 있는 방법이 없..
요즈음 상품 추천 알고리즘에 대해 고민을 많이 하면서, 리서칭하다 보면 MAB 접근법 등 Bandit 이라는 개념이 많이 등장한다. 이번 글에서는 Bandit 알고리즘이란 무엇이며, 추천시스템과는 어떻게 연결되는지를 살펴보고자 한다. 그리고 MAB 문제를 해결하는 여러 알고리즘에 대해 정리해볼 것이다. 우선 수확(Exploitation)과 탐험(Exploration)이라는 개념에 대해 고찰해보자. 우리가 어떤 레스토랑에서 밥을 먹을지 고민을 하고 있다고 가정해보자. 우리는 하나의 레스토랑에서 밥을 먹을 수 밖에 없고, 비용을 지불해야하니 가장 맛있는 레스토랑에서 식사를 하고 싶다. 수확이란 가장 효용이 높은 곳에서 집중적으로 보상을 받는 행동을 의미하고, 탐험은 지금껏 해보지 않은 경험이라 새로운 시..