일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 플랫폼
- 미국석사
- MAB
- BERT
- 머신러닝 파이프라인
- transformer
- docker
- MLOps
- TFX
- 클라우드
- COFIBA
- BANDiT
- MSCS
- RecSys
- 클라우드자격증
- Collaborative Filtering Bandit
- BERT이해
- chatGPT
- 언어모델
- nlp
- AWS
- 자연어처리
- HTTP
- 머신러닝
- 네트워크
- 메타버스
- 추천시스템
- 중국플랫폼
- aws자격증
- llm
Archives
- Today
- Total
Julie의 Tech 블로그
주변 친구 찾기 - 웹소켓, Redis, Redis Pub/Sub 본문
728x90
본 글은 아래 책을 읽고 요약된 정보입니다.
https://product.kyobobook.co.kr/detail/S000211656186
- 1장에서 보았던 근접성 서비스와는 살짝 다른 특징
- 근처 사업장 주소는 정적인 정보이지만 주변 친구는 위치가 자주 바뀔 수 있음
개요
지원자: ‘주변에 있다’는 기준은 수치적으로 얼마나 가까운 것인지?
- 5마일
지원자: 이를 직선거리로 가정해도 되는지?
- OK
지원자: 얼마나 많은 사람들이 이 앱을 사용하는지? 10억명 중 10% 정도?
- OK
지원자: 사용자의 이동 이력 보관 여부
- Yes
지원자: 친구 관계에 있는 사용자가 10분 이상 비활성 상태면 사용자를 목록에서 사라지게?
- Yes
지원자: GDPR, CCPA 같은 사생활 및 데이터 보호법 고민 필요?
- 좋은 지적, 일단 생략
요구사항
- 해당 친구까지의 거리
- 해당 정보가 마지막으로 갱신된 시각(timestamp)
- 친구 목록은 몇 초마다 갱신되어야함
비기능 요구사항
- 낮은 지연시간
- 안정성
- 결과적 일관성: strong consistency가 아니어도 됨
개략적 규모 추정
- ‘주변 친구’는 5마일(8km) 반경 이내 친구로 정의
- 친구 위치 정보는 30초 주기로 갱신. 사람이 걷는 속도를 감안했을 때 주변 친구 검색 결과가 크게 달라지지 않을 것이기 때문
- 동시 접속 사용자 수는 DAU의 10%로 추산
- 평균적으로 한 사용자가 400명의 친구를 갖는다고 가정. 그 모두가 주변 친구 검색 기능을 활용
- 페이지당 20명의 주변 친구를 표시, 사용자 요청이 있을 때 더 많은 친구들을 보여줌
개략적 설계안
- API 설계
- 위치 정보를 모든 친구에게 전송해야함. 이 때문에 클라이언트-서버 간 통신을 단순히 HTTP 프로토콜로 구성할 수는 없음
- 사용자는 근방의 모든 활성 상태 친구의 새 위치 정보를 수신해야함
- P2P방식 - 가장 단순
2. 소규모 백엔드 → 더 큰 규모로 확장 가능하도록 변경- 로드밸런서: RESTful API 서버와 웹소켓 서버 앞단에 위치
- RESTful API 서버: 친구를 추가/삭제 혹은 사용자 정보를 갱신하는 등의 부가적인 작업을 처리
- 웹소켓 서버: 친구 위치 정보 변경을 거의 실시간에 가깝게 처리. 클라이언트는 서버 한 대와 연결을 지속함
- Redis 위치 정보 캐시: 활성 상태 사용자의 가장 최근 위치 정보를 캐시하는데 사용, TTL 필드를 활용할 것
- 사용자 데이터베이스: 사용자 정보와 사용자의 친구 관계 정보를 저장, 관계형 혹은 NoSQL도 가능
- 위치 이동 이력 데이터베이스: 사용자의 위치 변동 이력을 보관. 주변 친구 표시와 직접적으로 관계된 기능은 아님
- Redis Pub/Sub 서버: 초경량 메시지 버스.
- 웹소켓 서버에서 수신한 특정 사용자의 위치 정보 변경 event를 해당 사용자에게 배정된 pub/sub채널에 배정
- Subscriber: 해당 사용자의 친구 각각과 연결된 웹소켓 연결 핸들러
- Publisher: 위치 정보가 갱신되었다는 event를 발행하려는 사용자들
- 위치 정보가 갱신되었다는 event를 발행하는 사용자가 publisher로 등록됨
- 해당 publisher별로 구독하고 있는 subscriber (친구들 각각의 웹소캣 연결 핸들러)로 broadcast. 이 때 친구가 활성상태이면 거리를 재계산
- 재계산한 거리가 검색 반경 이내이면 갱신된 위치와 갱신 시각을 웹소켓 연결을 통해 해당 친구의 웹소켓 서버를 통해 클라이언트 앱으로 보냄
- API 설계
- 서버 API: 주기적인 위치 정보 갱신, 웹소켓 초기화 API
- 클라이언트 API: 갱신된 친구 위치를 수신할 API, 새 친구 구독 API, 구독 해지 API
- 두 사용자 사이의 거리가 특정 임계치보다 먼 경우에는 변경 내역을 전송하지 않음
데이터 모델
- 위치 정보 캐시
- Redis와 같은 캐시로 구현
- ‘주변 친구’ 기능은 사용자의 현재 위치만을 이용하기 때문
- 위치 이동이력 데이터베이스
- 스키마
User_id | Latitude | Longtitude | Timestamp - 막대한 쓰기 연산 부하를 감당할 수 있어야함
- 수평적 규모 확장이 가능해야함
- 관계형 DB를 사용할 수도 있으나 이력 내용이 담기기 때문에 한 대에 보관하기에 너무 무거울 수 있어 샤딩이 필요함. 보통 사용자ID를 기준으로 샤딩
- 카산드라 DB를 추천
- 스키마
규모 확장성
- API서버, 특히 RESTful API 서버는 stateless 서버이기 때문에 손쉽게 확장 가능
- 웹소켓 서버인 경우는 stateful 서버라 기존 연결이 종료될 수 있게끔 처리해야함
- 사용자 DB의 경우 데이터를 샤딩하여 수평적 규모 확장이 가능함
- 위치 정보 캐시의 경우 활성사용자의 수와 정보 보관에 필요한 바이트 수를 추산하여 필요한 서버 수를 예측한다. 이 역시 샤딩을 손쉽게 할 수 있어 수평적 규모 확장이 가능하다
- 레디스 펍/섭은 채널을 만드는 비용이 매우 저렴하다. 채널 하나를 유지할 때 구독자 관계를 추적하기 위하여 해시테이블과 연결리스트가 필요한데 이는 매우 소량의 메모리만을 잡아먹는다.
- 분산 레디스 펍/섭 서버 클러스터
- 모든 채널이 서로 독립적이기 때문에 메시지를 발행할 사용자 ID를 기준으로 펍/섭 서버들을 샤딩하면 됨. 하지만 좀 더 매끄럽게 동작하게끔 하기 위해 서비스 탐색(service discovery) 컴포넌트를 도입
- 키-값 저장소, 즉 해시 링으로 가능한 서버 목록을 유지하게 됨
- 값은 레디스 펍/섭 서버가 됨. 예를 들어 총 4대의 서버가 있다고 했을 때 채널의 해시값을 구한 뒤 그 해시값이 속한 범주를 담당하는 레디스 펍/섭 서버를 찾음
- 모든 채널이 서로 독립적이기 때문에 메시지를 발행할 사용자 ID를 기준으로 펍/섭 서버들을 샤딩하면 됨. 하지만 좀 더 매끄럽게 동작하게끔 하기 위해 서비스 탐색(service discovery) 컴포넌트를 도입
- 레디스 펍/섭 서버 클러스터는 stateful 서버 클러스터일까?
- 특정한 채널을 담당하던 펍/섭 서버를 교체하거나 해시 링에서 제거하게 되는 경우 채널은 다른 서버로 이동시켜야하고, 해당 채널의 모든 구독자에게 그 사실을 알려야함. 그래야만 기존 채널에 대한 구독 관계를 해지하고 새 서버에 마련된 대체 채널을 다시 구독할 수 있기 때문. 이 관점에서는 stateful 서버
- Stateful 서버 클러스터는 규모를 늘리거나 줄일 때 운영 부담과 위험이 크다. 그래서 일반적으로 오버 프로비저닝을 한다.
변형
- 임의의 친구 정보
- 만약 친구관계가 아니지만 정보제공에 동의하여 주변 친구들을 찾을 수 있는 기능이 있다면?
- 지오해시에 따라 구축된 펍/섭 채널 풀을 두면 됨
- 정보제공에 동의한 사용자들에 한해 위치정보를 지오해시에 매핑하여 그 값의 채널을 구독하고있게함
- 이 때 격자 경계 부근에 있는 사용자를 처리하기 위해 본인이 위치한 지오해시 외에 주변 지오해시 격자 채널들에도 구독함
- 만약 친구관계가 아니지만 정보제공에 동의하여 주변 친구들을 찾을 수 있는 기능이 있다면?
반응형
'Tech' 카테고리의 다른 글
근접성 서비스(Proximity Service) - 지오해시, 쿼드트리, S2 (0) | 2024.02.15 |
---|---|
LLM OS? 언어모델이 제시하는 새로운 패러다임 (1) | 2023.11.25 |
Vector Store: Azure Vector Search에 대하여 (0) | 2023.08.22 |
[UIUC MCS 회고] 대학원을 졸업하며.. (8) | 2023.08.10 |
ChatGPT Plugin이란, 구축 방법 (0) | 2023.04.25 |