일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- transformer
- TFX
- BERT
- AWS
- MSCS
- MLOps
- 미국석사
- nlp
- 플랫폼
- llm
- 중국플랫폼
- 머신러닝 파이프라인
- 네트워크
- 클라우드
- chatGPT
- MAB
- 클라우드자격증
- 메타버스
- 추천시스템
- Collaborative Filtering Bandit
- 머신러닝
- aws자격증
- RecSys
- BERT이해
- docker
- COFIBA
- BANDiT
- 언어모델
- 자연어처리
- HTTP
Archives
- Today
- Total
목록웹크롤러 (1)
Julie의 Tech 블로그
검색 엔진의 구조와 이해
우리는 주로 인터넷을 통해 정보를 얻는다. 하지만 정보의 보고인 인터넷에서 원하는 정보만을 얻기는 어렵다. 우리는 이 과정에서 검색엔진의 도움을 받는다. 검색엔진은 사용자의 원하는 정보를 제공하기 위해 인터넷에 있는 데이터를 적절히 선별하여, 그 결과를 적절성에 따라 정렬하여 보여준다. 이 과정을 좀 더 다듬어 정리하면 아래와 같다 : 1) 크롤링(Crawling), 2) 인덱싱(Indexing), 3) 추출(Searching) 크롤링은 웹 로봇이 웹 페이지의 복사본을 만들어 웹 마다 어떤 정보가 담겨있는지를 파악하기 위해 저장하는 과정이다. 웹 로봇은 최초 페이지(아마 당시의 가장 인기 있고 접근이 많은 웹 페이지)에서 해당 페이지에 하이퍼링크로 걸려있는 다른 웹 페이즈들을 재귀적으로 방문하면서..
Tech
2022. 1. 22. 17:15