일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- BANDiT
- 머신러닝 파이프라인
- 머신러닝
- 언어모델
- docker
- 자연어처리
- MLOps
- nlp
- RecSys
- aws자격증
- TFX
- COFIBA
- AWS
- 미국석사
- 플랫폼
- 클라우드
- chatGPT
- 메타버스
- HTTP
- transformer
- Collaborative Filtering Bandit
- BERT
- 클라우드자격증
- 추천시스템
- MAB
- MSCS
- llm
- 네트워크
- BERT이해
- 중국플랫폼
- Today
- Total
목록RecSys (7)
Julie의 Tech 블로그
이번 글은 추천시스템의 아키텍쳐로 떠오르는 multi-stage recommendation system 구조에 대해 간단히 살펴본 후, 가장 마지막 stage로 분류되는 're-ranking(재순위화)'에 대해 개괄적으로 다뤄볼 것이다. 본 글은 2022 RecSys의 tutorial에 소개된 survey 논문 중 하나인 neural re-ranking for multi-stage recommender systems를 참조하였다. 추천시스템에서의 아이템과 유저는 굉장히 방대하면서 동시에 sparse하다. 그리고 데이터를 수집하여 사용 가능한 형태로 만들고, 다시 모델로 추론하여 FE에 제공하기까지 상당히 여러 단계를 거쳐야한다. 최근 추천시스템 분야에서는 이를 각 단계로 분리한 multi-stage ..
이번 글은 BERT4Rec에 이어서 NLP 모델인 Transformer가 추천시스템에 어떻게 적용될 수 있는지 연구한 논문에 대해 다뤄볼 것이다. 이번 논문은 저번 BERT4Rec이 순차적인(Sequential) 추천시스템에 적용된 것에서 더 나아가 Session-based, 즉 좀 더 짧은 인풋인 세션 단위에서의 추천시스템에 초점을 두고 있다. 요즈음의 이커머스, 뉴스, 혹은 미디어 포털에서의 유저 상호작용은 굉장히 짧은 형태이다. 이 배경에는 쿠키 수집 제한 정책과 같은 법적인 이슈도 있지만 큰 이유로는 유저의 선호가 다이나믹하게 바뀌기 때문이다. 본 논문은 NVIDIA에서 발표하였으며, BERT4Rec과 다르게 방법론을 다룬 논문이 아니라 직접 모델을 학습하여 배포한 오픈소스 라이브러리를 소개하고 ..
본 시리즈는 추천 시스템에 대해, 특히 Collaborative Filteirng 방식에 대해 좀 더 깊이 있게 다뤄볼 것이다. 이번 글은 첫 편인 만큼 추천 시스템과 그와 관련된 기본적인 개념/툴들에 대해 개괄적으로 훑어볼 것이다. 데이터 마이닝 (요즈음은 데이터 사이언스라고 더 불리는 듯 함) 은 데이터를 모아 분석한 이후 정보를 추출하는 기술이다. 정보란 좀 더 유의미(useful)하고 일반적이지 않은(non-trivial) 데이터를 의미한다. 데이터 마이닝 기술에는 여러 가지 토픽들이 있다. - 분류(Classification) - 군집화(Clustering) - 이상탐지(Outlier Detection) - 연관분석(Association Rules) 이러한 데이터 마이닝 기술은 추천 시스..
Context Adaptation for Smart Recommender Systems https://www.researchgate.net/publication/284218062_Context_Adaptation_for_Smart_Recommender_Systems Introduction 이번에 리뷰할 논문은 지금껏 살펴봤던 알고리즘과 유사하게 context를 반영하는 Bandit 알고리즘이다. 본 논문은 추천 시스템에 있어 Context가 매우 중요하다는 논조로 시작된다. 훌륭한 알고리즘만으로 뛰어난 성과(CTR혹은 전환율)를 이끌어내긴 어렵다고 하며, 사용자의 context 요인도 알고리즘에 반영되어야한다고 한다. 주로 이커머스 시장에서의 추천 시스템에 초점을 맞춰두고 있으며, 아래와 같이 두 가지에..
이전 글에서는 COFIBA모델의 pseudo code와 각 구간별 로직에 대해 설명을 담았었다. 이번 글에서는 해당 모델이 세 개 테스트 데이터 셋에서 어떤 성과를 내었으며, 어떤 결론을 내릴 수 있는지 다룰 것이다. 수식 편집기 한계로, 글에서 기울임체로 작성하는 변수는 각각 아래와 같이 이해하면 된다. 1) 야후 뉴스 추천 데이터셋 - 2주간 야후 내 'Today Module' 섹션에 유입된 3000만 트래픽 기록 중 random하게 셀렉 - 뉴스 추천과 방문자가 모두 random하게 꾸려짐 - 유저 벡터 > it (136개 feature dimension), 뉴스 컨텐츠 > Cit, 클릭 여부 > at 2) Telefonica 광고 데이터셋 - Telefonica에서 운영하는 웹사이트 내 광고 클릭..
지난번에는 CF와 stochastic MAB를 합친 COFIBA모델을 간단히 소개했다. 이번에는 그 모델의 pseudo code를 보면서 로직을 정확히 이해해보고자 한다. 우선 간략히 모델의 알고리즘 로직 순서를 요약하면 아래와 같다. 1. t번째 라운드에서 모델은 특정 유저에게 추천 가능한 아이템 리스트 중 가장 기대보상이 큰 아이템을 선택 2. 선택 결과에 따라 유저로부터 실제 보상 결과를 받음 3. 실제 보상 결과에 따라 모델이 업데이트됨 3-1. 모델 파라미터 업데이트 3-2. 유저 클러스터, 아이템 클러스터 순으로 업데이트 4. 1-3 반복 좀 더 자세하게 알아보자. Intial Setting : input, output 각 용어별 정의는 아래와 같다. U는 유저 그룹, I는 콘텐츠 그룹..