2024년 패스트 캠퍼스 챌린지

패스트캠퍼스 환급챌린지 33일차 미션 (3월 4일) : 30개 프로젝트로 끝내는 추천시스템 구현 초격차 패키지 강의 후기

조이쓰 2024. 3. 4. 21:59

강의 내용 Review


📍배운내용📍

  • 피처 정보 활용 

👉강의내용👈

피처 정보 활용

    • 컨텐츠 기반 추천 모델 제공하고 유저가 상호작용을 충분히 쌓지 않더라도 어느정도 연관성있는 추천 제공
    • 데이터 Sparsity는 데이터가 희박하게 있는것, 추천 시스템에서는 흔한 현상 
    • 서비스와 유저가 커져감에 따라 데이터 희박성이 높아짐 
    • 상호작용이 많을 수록 더 좋은 연관성의 추천 생성함 
    • 콜드 스타트 문제를 해결하기 위해 제안방법 
    • 1)  트리기반 모델: Light GBM은 상호작용이 없어도 추천 가능, 연관성을 그럴듯하게 추천 가능   
    • 2) Factorization Model : 새로운 피처조합이 있어도 강건한 추천 가능
    • 3) DL기반 Feature추출 모델: 비정형데이터를 기반으로 연관도 있는 추천 제공 
    • Point wise prediction : 신규 아이템과 유저가 있을때 각각 피처를 넣기만 하면 피처 추출 모델을 통해서 예측가능 
    • 기존의 인터렉션 정보가 충분하지 않아도 컨텐츠 기반 추천으로 좀더 연관성 있는 추천 가능

비지니스 케이스

  • 중고차량 추천 시스템: 모바일 De는 중고차 플랫폼, 많은 유저와 중고 자동차 
  • 상품의 피처로 부터 비선형 패턴을 잡기 위해 딥러닝 사용
  • 추천 시스템 구성 방법: 구독한 사람의 이벤트 수집, 가격 상태 국가 등 다양한 변수 사용 
  • 콜드 스타트를 해결하기 위해 시작 했지만 유저 임베딩과 아이템의 피처를 사용함으로 신규 아이템이 등장하더라도 개연성이 있는 아이템 추천 가능 할 것으로 기대 

MAB알고리즘

  • 강화 학습의 기반 알고리즘 : 강화학습의 기초적인 형태 
  • 유저의 반응에 따라 조금씩 적응형으로 전략을 다르게 취함 
  • 메타 정보와 상호작용정보가 없는 것의 초기의 추천을 가능하게 함, 실시간으로 유저의 반응감지하고 전략을 업데이터 함에 유저의 반응 더 최적화 된 추천 제공 가능 
  • 여러 팔 중 한개의 선택 해야하는 슬롯 
  •  제약상황안에서 최적의 이득을 얻는 방법 
  • 강화학습: 에이전트가 정책을 수정하는 방법으로 학습함, 환경, 보상, 행동 
  • 일전한 보상, 변칙 보상 
  • 탐색과 활용의 트레이드 오프: 최단에서 가장 좋은 이득을 선택 햐야함
  • 그리디 알고리즘: 평균보상, 수익이 잘나오는 것을 탐욕적으로 탐색 
  • 엡실론 그리디: 가끔 살펴보기
  • UCB: 덜 살 펴본것들에 대해 꼼꼼히 보자, 신뢰도를 더 보겠다

 공부사진 


33일차 후기


어렵네ㅠㅠ 

잘 듣자 

 

 

 

 

본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다.

https://bit.ly/48sS29N