-
패스트캠퍼스 환급챌린지 9일차 미션 (2월 9일) : 30개 프로젝트로 끝내는 추천시스템 구현 초격차 패키지 강의 후기2024년 패스트 캠퍼스 챌린지 2024. 2. 9. 22:00
강의 내용 Review
📍배운내용📍
- 행렬분해 알고리즘
👉강의내용👈
행렬분해 알고리즘
- 협업필터링 기반 알고리즘
- 인터랙션 메트릭스 : 행렬의 상호작용
- 평점의 경우는 유저의 직접적인 선호도의 척도가 있고, 클립 정보는 반복적인 상호작용의 정보가 있음
- 행렬분해의 일반적인 설명: 평점행렬을 두개의 작은 행렬로 쪼개서 그 곱으로 평점을 계산
- 유저와 아이템 인터렉션에 대해서 추론을 함, 각각의 메트릭스는 아이템과 유저의 레이턴트 벡터
- MF: 매트릭스 팩토리제이션(분해)
- 한 값을 곱의 형태로 나타냄
- 분할을 해서 원래 행렬의 정보를 다 가지고 있지 않도록 압축함
- 데이터 사이에 노이즈는 제거하고 중요한 패턴에 집중함
- 평점 행렬을 두개의 행렬로 팩토라이제이션
- 유저의 선호 메트릭스와 아이템의 선호 메트릭스
- SGD는 그래디언트를 조금씩 업데이트 하는 방식으로 학습
- ALS: 최적화 할때 하나를 최적화하고 나머지를 최적화 함
- Latent Factor의 직관: 사이의 거리를 계산할수있는 레이텐터 벡터
- SVD: 얼굴이 복원되는 예제
- 하나의 이미지를 행렬로 표현해서 중요한 K개의 팩터 추출
- 데이터 , 이미지 압축에 사용됨
- 협을 필터링의 시그널을 잡아내는데 사용함
- 특잇값 분해: 정방행렬이 아닌 M*N모양
- 모든 행렬이 벡터에 대한 선형변환인데 유저에 대한 기저를 격파했을때 이런것들을 평점 행렬을 통해 이러한 공간에 맵핑시키는, 리니어 트랜스포메이션 해주는 함수, v와 시그마 u세개로 나눔
- 원래의 선형변환이 만드는 결과에 도달할수있게 해줌
- 결과값 테이블은 원래 데이터와 똑같은 형태
- 평점을 복원을 할때 사용할수있는 이유는 중요한 시그널을 갖는 중요한 팩터 몇개만 두고 나머지를 노이즈로 자르고 중요한 팩터만 사용해서 노이즈가 제거된 원래 평점을 복원 할수있음
- 그림에서 보듯이 M개에서 k개만 남기는데 이들만으로 충분한 평점을 근사한 값으로 복원하고 노이즈를 제거함으로 더 잘 예측할수있음
- 가장 중요한 유저의 피처와 영화의 피처를 남겨두게됨
- 유저들이 비슷한 애들과 특징을 잡아냄
- 사람이 해석하기 어려운 패턴임
- 평점행렬 내에서 내제된 협업필터링 시그널을 행렬분해 방식을 통해서 레이턴트 벡터안에 효율적으로 오게 되고 잠재요인을 통해서 다시 원래 행렬을 복원시키는 방법으로 예측 함
공부사진
9일차 후기
오늘은 행렬기반 분해에 대해서 들었다.
본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다.
'2024년 패스트 캠퍼스 챌린지' 카테고리의 다른 글