-
패스트캠퍼스 환급챌린지 20일차 미션 (2월 20일) : 30개 프로젝트로 끝내는 추천시스템 구현 초격차 패키지 강의 후기2024년 패스트 캠퍼스 챌린지 2024. 2. 20. 21:34
강의 내용 Review
📍배운내용📍
- DeepFM
- EBM 모델 실습
👉강의내용👈
DeepFM
- 선형 모델인FM모델에게 비선형적인 패턴을 포착하게 하는것
- 하나의 입력을 받아서 선형과 비선형을 동시에 포착할수있게 단일 모델로 구현
- 연산효율이 좋음
- 많은 딥러닝 기반 추천모델에 베이스 모델로 쓰이기도 함
- CTR prediction: 유저가 특정 상품과 광고를 클릭 할 확률을 예측
- 피처의 상호작용을 잡아내는것이 중요함
- 2차, 3차 인터렉션은 피처간의 상호작용을의미 - 경우에 수에 따라 여러가지 조합 가능
- 기존의FM모델은 고차 인터렉션을 잡아내기 어려움
- wide and deep은 학습과 구현이 복잡하고 cross production이 사람이 정해야하는 귀찮음이 존재함
- 입력 데이터 형태 : 유저ID, itemID, 유저 피처, 아이템 피처, 시간, y(클릭-1, Non클릭 0)
- 모델의 구성 : FM과 DNN으로 구성됨
- FM part: spars한 원핫피처가 각 필드마다 있음 , 이들에 대해 대응되는 임베딩 값이 있고 임베딩 통과전에 spars와 피처에 대해 weight텀을 선형적으로 결합을 해줌
- 피처간에 2차,3차 상호작용을 잡아냄, 이후 시그모이드를 통해 FM 결과값을 구함
- DNN part: FM머신 입력을 재사용함, 필드마다 임베딩을 생성했던 걸 가지고 히든 레이어를 통과시켜서 최종 출력 벡터 생성
- FM과 DNN을 결합해서 하나의 시그모이드 출력을 만듦
- NFM: 선형성과 고차인터렉션을 잡아내지 못하는 것을 위해 제안됨
- Bi-inderaction Pooling: 고차및 비선형을 잡아냄
- 새로운 파라미터를 새로 학습 할 필요없이 피처간의 2번째 인터렉션을 잡아냄 , 요소 곱을 사용함
- 특징: 정보의 차이도 반영할수있음
- 광고추천 회사의 FM모델 실험 결과
- 온라인 타겟 광고 제공 기업: 온라인 상의 유저 행동을 분석하는 것이 중요함
- 선형모델과 트리기반 모델 을 사용함 -> 트리기반 모델의 성능이 강력함
- 뉴럴넷 : 피처가 많은데 데이터가 많지 않아서 어려움이있음
- NFM: 파라미터 수도 작고 수렴이 빨리 이루어짐
- 필드를 고려하는 것이 중요함
공부사진
20일차 후기
실제 광고회사의 모델 적용 사례를 같이 볼수있어서 좋았다.
본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다.
'2024년 패스트 캠퍼스 챌린지' 카테고리의 다른 글