2024년 패스트 캠퍼스 챌린지
패스트캠퍼스 환급챌린지 33일차 미션 (3월 4일) : 30개 프로젝트로 끝내는 추천시스템 구현 초격차 패키지 강의 후기
조이쓰
2024. 3. 4. 21:59
강의 내용 Review
📍배운내용📍
- 피처 정보 활용
👉강의내용👈
피처 정보 활용
- 컨텐츠 기반 추천 모델 제공하고 유저가 상호작용을 충분히 쌓지 않더라도 어느정도 연관성있는 추천 제공
- 데이터 Sparsity는 데이터가 희박하게 있는것, 추천 시스템에서는 흔한 현상
- 서비스와 유저가 커져감에 따라 데이터 희박성이 높아짐
- 상호작용이 많을 수록 더 좋은 연관성의 추천 생성함
- 콜드 스타트 문제를 해결하기 위해 제안방법
- 1) 트리기반 모델: Light GBM은 상호작용이 없어도 추천 가능, 연관성을 그럴듯하게 추천 가능
- 2) Factorization Model : 새로운 피처조합이 있어도 강건한 추천 가능
- 3) DL기반 Feature추출 모델: 비정형데이터를 기반으로 연관도 있는 추천 제공
- Point wise prediction : 신규 아이템과 유저가 있을때 각각 피처를 넣기만 하면 피처 추출 모델을 통해서 예측가능
- 기존의 인터렉션 정보가 충분하지 않아도 컨텐츠 기반 추천으로 좀더 연관성 있는 추천 가능
비지니스 케이스
- 중고차량 추천 시스템: 모바일 De는 중고차 플랫폼, 많은 유저와 중고 자동차
- 상품의 피처로 부터 비선형 패턴을 잡기 위해 딥러닝 사용
- 추천 시스템 구성 방법: 구독한 사람의 이벤트 수집, 가격 상태 국가 등 다양한 변수 사용
- 콜드 스타트를 해결하기 위해 시작 했지만 유저 임베딩과 아이템의 피처를 사용함으로 신규 아이템이 등장하더라도 개연성이 있는 아이템 추천 가능 할 것으로 기대
MAB알고리즘
- 강화 학습의 기반 알고리즘 : 강화학습의 기초적인 형태
- 유저의 반응에 따라 조금씩 적응형으로 전략을 다르게 취함
- 메타 정보와 상호작용정보가 없는 것의 초기의 추천을 가능하게 함, 실시간으로 유저의 반응감지하고 전략을 업데이터 함에 유저의 반응 더 최적화 된 추천 제공 가능
- 여러 팔 중 한개의 선택 해야하는 슬롯
- 제약상황안에서 최적의 이득을 얻는 방법
- 강화학습: 에이전트가 정책을 수정하는 방법으로 학습함, 환경, 보상, 행동
- 일전한 보상, 변칙 보상
- 탐색과 활용의 트레이드 오프: 최단에서 가장 좋은 이득을 선택 햐야함
- 그리디 알고리즘: 평균보상, 수익이 잘나오는 것을 탐욕적으로 탐색
- 엡실론 그리디: 가끔 살펴보기
- UCB: 덜 살 펴본것들에 대해 꼼꼼히 보자, 신뢰도를 더 보겠다
공부사진


33일차 후기
어렵네ㅠㅠ
잘 듣자
본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다.