패스트캠퍼스 환급챌린지 33일차 미션 (3월 4일) : 30개 프로젝트로 끝내는 추천시스템 구현 초격차 패키지 강의 후기

2024년 패스트 캠퍼스 챌린지

패스트캠퍼스 환급챌린지 33일차 미션 (3월 4일) : 30개 프로젝트로 끝내는 추천시스템 구현 초격차 패키지 강의 후기

조이쓰 2024. 3. 4. 21:59

강의 내용 Review

📍배운내용📍

피처 정보 활용

👉강의내용👈

피처 정보 활용

컨텐츠 기반 추천 모델 제공하고 유저가 상호작용을 충분히 쌓지 않더라도 어느정도 연관성있는 추천 제공
데이터 Sparsity는 데이터가 희박하게 있는것, 추천 시스템에서는 흔한 현상
서비스와 유저가 커져감에 따라 데이터 희박성이 높아짐
상호작용이 많을 수록 더 좋은 연관성의 추천 생성함
콜드 스타트 문제를 해결하기 위해 제안방법
1) 트리기반 모델: Light GBM은 상호작용이 없어도 추천 가능, 연관성을 그럴듯하게 추천 가능
2) Factorization Model : 새로운 피처조합이 있어도 강건한 추천 가능
3) DL기반 Feature추출 모델: 비정형데이터를 기반으로 연관도 있는 추천 제공
Point wise prediction : 신규 아이템과 유저가 있을때 각각 피처를 넣기만 하면 피처 추출 모델을 통해서 예측가능
기존의 인터렉션 정보가 충분하지 않아도 컨텐츠 기반 추천으로 좀더 연관성 있는 추천 가능

비지니스 케이스

중고차량 추천 시스템: 모바일 De는 중고차 플랫폼, 많은 유저와 중고 자동차
상품의 피처로 부터 비선형 패턴을 잡기 위해 딥러닝 사용
추천 시스템 구성 방법: 구독한 사람의 이벤트 수집, 가격 상태 국가 등 다양한 변수 사용
콜드 스타트를 해결하기 위해 시작 했지만 유저 임베딩과 아이템의 피처를 사용함으로 신규 아이템이 등장하더라도 개연성이 있는 아이템 추천 가능 할 것으로 기대

MAB알고리즘

강화 학습의 기반 알고리즘 : 강화학습의 기초적인 형태
유저의 반응에 따라 조금씩 적응형으로 전략을 다르게 취함
메타 정보와 상호작용정보가 없는 것의 초기의 추천을 가능하게 함, 실시간으로 유저의 반응감지하고 전략을 업데이터 함에 유저의 반응 더 최적화 된 추천 제공 가능
여러 팔 중 한개의 선택 해야하는 슬롯
제약상황안에서 최적의 이득을 얻는 방법
강화학습: 에이전트가 정책을 수정하는 방법으로 학습함, 환경, 보상, 행동
일전한 보상, 변칙 보상
탐색과 활용의 트레이드 오프: 최단에서 가장 좋은 이득을 선택 햐야함
그리디 알고리즘: 평균보상, 수익이 잘나오는 것을 탐욕적으로 탐색
엡실론 그리디: 가끔 살펴보기
UCB: 덜 살 펴본것들에 대해 꼼꼼히 보자, 신뢰도를 더 보겠다

공부사진

33일차 후기

어렵네ㅠㅠ

잘 듣자

본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다.

https://bit.ly/48sS29N

저작자표시 (새창열림)