패스트캠퍼스 환급챌린지 43일차 미션 (3월 14일) : 30개 프로젝트로 끝내는 추천시스템 구현 초격차 패키지 강의 후기

조이쓰 2024. 3. 14. 12:20

강의 내용 Review

레이블 생성: 긍정, 부정레이블 정하기, 어떤것을 부정으로 정할지 (구매여부, 클릭여부)
세션 데이터, 전체 데이터를 기반으로 모든 유저와 아이템에 행렬을 그리고 구매했으면 1, 안했으면 0
노출된적도 없는 것을 부정으로 할수는 없음, 세션 기반으로 보기만한것, 클릭 한것 등을 정의할수있음
같이 산 상품을 구하기, 한 유저가 산 전체 상품, 장바구니 상품, 일정기간동안 산 상품 등등 정의가 도메인을 고려해서 필요함
부정 레이블을 샘플링할것인가? 클래스 불균형이 발생함, 중복 제거등등 문제가 있음
Contiunous Feedback : 사용자, 후보자, 애션, 컨텍스트, 집합, 윈도우 순서로 데이터 구성
Contiunous Feedback 데이터는 집합의 결과를 피처로 사용하는 경우가 많음, 적은 데이터로 효과적으로 학습하기 위해, 데이터들이 피처에 포함되어있어서 효과적으로 학습가능
유저 퍼널이란 고객의 유입부터 구맥 까지 UX상의 단계 (노출 -> 클릭 -> 장바구니 -> 구매 -> 평점)
개념 모델을 구성하고 Entity 추출, Entity 그룹핑, 콜드스타트와 희소성 문제 해결 가능함
Entity, Action, 기간, agg함수 선택 : 유저가 한달간 시청한 영화장르 비율 등으로 피처 생성 가능
1) 컨텍스트를 활용해서 피처 사이즈 줄임, 2) 너무 희소 데이터 생성하지 않도록 주의

고려 해야할게 많네..