2024년 패스트 캠퍼스 챌린지
패스트캠퍼스 환급챌린지 48일차 미션 (3월 19일) : 30개 프로젝트로 끝내는 추천시스템 구현 초격차 패키지 강의 후기
조이쓰
2024. 3. 19. 23:37
강의 내용 Review
📍배운내용📍
- DLRM
- DCN v2
👉강의내용👈
DLRM
- 메타에서 2019년도 공개한 딥러닝 랭킹 모델
- 구조는 간단함, 임베딩 모델, 뉴럴네트워크 레이어, 인터렉션 레이어, 예측 레이어가 있음
- 하이브리드 모델로 deep과 wide를 사용함, 대규모 데이터를 분산적으로 효율적으로 처리함, 개인화 된 추천 가능, 페이스북에서 현재 사용중
- 덴스피처와 희소 피처를 임베딩 룩업으로 처리하고 피처 상호작용으로 처리하고 마지막에 많은 레이어를 사용해서 처리함
- 덴스 피처 처리법: 일반 레이어를 쌓아서 처리함, 아웃풋이 임베딩 레이어랑 같아야함, 임베딩 간의 내적을하려면 임베딩의 사이즈가 같아야함
- 스파스 피차: 임베딩 룩업을 사용하고 상호작용 레이어를 사용하기 위해 같은 사이즈의 임베딩 크기를 가져야함
- 피처 인터렉션: 내적, 바텀 MLP결과와 합히고 마지막에 시그모이드로 결과예측
- 심플한 구조로도 좋은 성능을 낼수 있음, 모든 벡터 사이즈가 같아야하는데 이는 피처의 차이(카테고리컬 피처)에 따라 벡터값이 많이 달라지는데 각 피처를 같은 임베딩 크기로 표현하기 어려울수있음
- 사용자가 많아질수록 임베딩 테이블의 크기가 커짐, 이것을 분산으로 처리하는 것이 중요함
DCN
- DCN v2 : 구글의 광고 추천에서 사용함
- wide and deep을 결합한 구조이고 유연한 모델링이 가능
- deep netowrk: 레이어를 쌓는 부분, 입력 데이터간의 연관성 고려함
- cross network: 피처 인터렉션을 배우는 부분, 교차항을 고려해서 모델을 잘 학습하게 함
- FM: 선형 + 두번쨰 오더를 계산하는 부분으로 나뉨
- wide & deep: 딥러닝 네트워크와 FM에서 나오는 크로스 피처를 동시에 사용함
- 어떤 항을 사용할지 수동으로 선택해야함, 피처 엔지니어링이 증가함
- 어떤 피처 크로스가 중요한지 찾아주고, 효율적으로 계산가능함
- 카테고리컬 피처에 따라서 보카 사이즈에 맞에 적적한 임베딩 사이즈 선택 가능, 서로 다른 임베딩 사이즈 선택 가능
- 성능과 모델 사이즈 간에 트레이드 오프 할수있는 방법을 제시함
- stacked와 parallel 구조가 있음, 데이터와 상황에 따라 선택 가능
- 임베딩 레이어는 비슷함, 크로스 네트워크에 레이어를 겹칠수록 더 계산이 많아지고 레지듀얼을 사용함
- 크로스 네트워크중 한 파트는 풀리 커넥트드 부분과 같음이후 엘리먼트 와이즈 곱을 x0(처음 들어온 값)와 곱하고 xi를 더함 : 간단하지만 효율적이고 성능이 좋음
- Low-Rank 크로스 레이어: 트레이드 오프 구현 가능
공부사진


48일차 후기
얼른 얼른 듣자~!
본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다.