일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 미국석사
- 자연어처리
- nlp
- transformer
- 클라우드
- 머신러닝
- RecSys
- BERT
- COFIBA
- MLOps
- AWS
- TFX
- llm
- MSCS
- chatGPT
- 중국플랫폼
- 네트워크
- aws자격증
- MAB
- 언어모델
- 머신러닝 파이프라인
- BERT이해
- BANDiT
- 추천시스템
- 플랫폼
- docker
- 메타버스
- 클라우드자격증
- HTTP
- Collaborative Filtering Bandit
- Today
- Total
목록Tech/RecSys (17)
Julie의 Tech 블로그
이번 글은 추천시스템의 아키텍쳐로 떠오르는 multi-stage recommendation system 구조에 대해 간단히 살펴본 후, 가장 마지막 stage로 분류되는 're-ranking(재순위화)'에 대해 개괄적으로 다뤄볼 것이다. 본 글은 2022 RecSys의 tutorial에 소개된 survey 논문 중 하나인 neural re-ranking for multi-stage recommender systems를 참조하였다. 추천시스템에서의 아이템과 유저는 굉장히 방대하면서 동시에 sparse하다. 그리고 데이터를 수집하여 사용 가능한 형태로 만들고, 다시 모델로 추론하여 FE에 제공하기까지 상당히 여러 단계를 거쳐야한다. 최근 추천시스템 분야에서는 이를 각 단계로 분리한 multi-stage ..
이번 글은 BERT4Rec에 이어서 NLP 모델인 Transformer가 추천시스템에 어떻게 적용될 수 있는지 연구한 논문에 대해 다뤄볼 것이다. 이번 논문은 저번 BERT4Rec이 순차적인(Sequential) 추천시스템에 적용된 것에서 더 나아가 Session-based, 즉 좀 더 짧은 인풋인 세션 단위에서의 추천시스템에 초점을 두고 있다. 요즈음의 이커머스, 뉴스, 혹은 미디어 포털에서의 유저 상호작용은 굉장히 짧은 형태이다. 이 배경에는 쿠키 수집 제한 정책과 같은 법적인 이슈도 있지만 큰 이유로는 유저의 선호가 다이나믹하게 바뀌기 때문이다. 본 논문은 NVIDIA에서 발표하였으며, BERT4Rec과 다르게 방법론을 다룬 논문이 아니라 직접 모델을 학습하여 배포한 오픈소스 라이브러리를 소개하고 ..
추천시스템과 자연어처리 모델은 함께 떠올리기 쉽지 않다. 우리가 통상 생각하는 추천시스템은 아이템과 유저를 대상으로 하는데, 자연어처리 모델은 언어를 대상으로 하기 때문이다. 하지만 몇몇 사람들은 자연어처리 모델을 추천시스템에 적용해보기를 시도했다. 그 이유는 유저가 순차적인 이벤트(혹은 activity)를 발생시키는 경우 순차성을 지닌 텍스트 데이터와 유사한 속성을 지닌 데이터로 여길 수 있기 때문이다. 그 외에도 유저의 반응(implicit 혹은 explicit feedback)이 희소(sparse)하다는 것과 one-hot encoding으로 데이터를 임베딩한다는 것이 유사점으로 꼽을 수 있다. 딥러닝 언어 모델이 점차적으로 발전해나가면서 순차적인(Sequential) 추천 모델도 함께 발전..
본 글은 이커머스 시장에서의 추천 시스템을 어떻게 구현하는지 개괄적으로 살펴볼 것이다. 이커머스에는 여러 종류가 있다. 쿠팡 / 11번가 / G마켓은 종합 커머스이고, 무신사는 패션 커머스에 해당한다. 하지만 이커머스의 추천은 대체로 유사하게 흘러간다. 대략적으로 틀을 잡으면 아래와 같다. 1. 홈 : 개인화 추천, 인기 상품 추천, 성별/연령 기반 추천 2. 검색 : 검색어 추천(인기 검색어 등), 검색어와 연관 상품 추천 3. 상품상세 페이지 : 주로 대체 상품 추천 (연관 상품 추천도 있음) 4. 장바구니 페이지 : 보완 상품 추천 어떤 추천을 할 것인가라는 문제를 풀기 위한 방식으로 모델을 분류해볼 수 있다. 예를 들어 모델 알고리즘으로는 대표적으로 CBF(Context-based Filterin..
본 글에서는 추천 시스템 문제 중 하나인 One-class 협업필터링에 대해 정의를 짚고, 그를 해결하기 위한 알고리즘들을 간단하게 소개해볼 것이다. One-class Collaborative Filtering이란 One-class collaborative filtering의 문제정의에 대해 살펴보자. Input은 사용자의 implicit한 피드백을 받고, output으로는 사용자의 top N 상품을 추천하는 것이다. 여기서 implicit한 피드백이라는 것은, 명확한 피드백이 아니라는 것인데, 즉 rating과 같이 직접적으로 유저가 선호를 매긴 것이 아니라는 것이다. rating은 통상 1부터 5점까지 scaled된 점수를 매기게 되지만, implicit 피드백은 구매 이력이라던지, 브라우징 이력..
본 시리즈는 추천 시스템에 대해, 특히 Collaborative Filteirng 방식에 대해 좀 더 깊이 있게 다뤄볼 것이다. 이번 글은 첫 편인 만큼 추천 시스템과 그와 관련된 기본적인 개념/툴들에 대해 개괄적으로 훑어볼 것이다. 데이터 마이닝 (요즈음은 데이터 사이언스라고 더 불리는 듯 함) 은 데이터를 모아 분석한 이후 정보를 추출하는 기술이다. 정보란 좀 더 유의미(useful)하고 일반적이지 않은(non-trivial) 데이터를 의미한다. 데이터 마이닝 기술에는 여러 가지 토픽들이 있다. - 분류(Classification) - 군집화(Clustering) - 이상탐지(Outlier Detection) - 연관분석(Association Rules) 이러한 데이터 마이닝 기술은 추천 시스..