2024년 패스트 캠퍼스 챌린지

패스트캠퍼스 환급챌린지 14일차 미션 (2월 14일) : 30개 프로젝트로 끝내는 추천시스템 구현 초격차 패키지 강의 후기

조이쓰 2024. 2. 14. 21:05

강의 내용 Review


📍배운내용📍

  • RNN알고리즘
  • 손실함수와 최적화 실습 

👉강의내용👈

RNN알고리즘

  • 텍스트, 음성, 시계열에 사용되고 있음 
  • 시퀀스 데이터 : 순서 정보를 담은 데이터 
  • 시간의 흐름의 정보를 담음, 시간의 흐름에 따른 증가, 순서적으로 구매한 제품 데이터 
  • 시간의 순서를 담는 정보를 NLP는 담을수없다는 단점을 고려해 RNN이 개발됨 
  • POS(Part of Speech) tagging : 주변 맥락에 따라서 동일한 단어라고 해도 다른 품사가 될수있음 
  • 단순한 MLP는 데이터 포인터간에 컨텍스트와 순서를 고려하지 않고 입력을 독립적으로 처리 
  • RNN:기존의 컨텍스트를 고려할수있도록 생성된 모델 
  • 시간의 흐름에 따라서 출력이 입력으로 들어가고 순환적으로 입력됨 
  • 이전 스테이트의 상태를 다음 스테이트로 전달함으로 컨텍스트 정보 활용
  • 기억 정보를 통해 이전에 무엇을 봤는지 활용
  • 히든 스테이트: 각각의 타임스텝이 다음 타임스템으로 넘너갈때 가운데 있는 요약된 정보가 히든 스테이트 
  • 타임스템에서 히든 스테이트를 가지고 이 히든 스테이트는 전 히든 스테이트와 현재 토큰의 결합된 정보를 가짐 
  • 히든 스테이트 는 계속 업데이트됨, 벡터의 정보가 섞임 
  • RNN아이디어 : 토큰의 표현, 이 스테이트의 표현을 히든 스테이트라고 함 -> 이것을 다음 타임으로 전달하면서 모델이 가지고 있던 기억을 다음 타임으로 전달 
  • 시퀀스로 할수있는 태스크로는 감성분석, 텍스트 생성등 많은 태스크 가능
  • 다대다(기계번역, 객체명인식, 품사태깅), 다대일(문장분류)로 사용할수있음 
  • RNN의 한계: 가중치 소실, 역전파 중에 가중치가 너무 작아질때 생기는 현상 
  • 히든 스테이트에서 0에가까운 값이 나오면 파라미터가 업데이트가 안될수도 있고 기울기 폭발이 될수도있음 
  • LSTM: 오래 기억할 정보와 빨리 잊어버릴 정보 나눠서 접근 
  • 히든 스테이트: 단기 기억 저장소 
  • 셀 스테이트 : 장기 저장소 역할 
  • 게이트에 대해서 값이 얼마나 추가될지, 버려질지 정해짐 
  • 인풋데이터가( 텍스트에 따른 임베딩) 들어오면 이전 타임 스텝의 히든 스테이트가 같이 들어옴 
  • 과거의 값이 시스모이드를 통해서 과거의 정보를 얼마나 장기기억으로 저장될지 정함(포겟 게이트)
  • 모든 정보를 저장하려면 1, 0이면 모두 버려라는 뜻
  • 아웃풋 에서 셀스테이트를 얼마나 반영할지 결정함 
  • 추천시스템에 적용방법: 시퀀셜 추천 시스템에 적용가능 :  그거 샀으면 다음에는 이거 필요하지 않아?
  • 협업 필터링, 컨텐츠 필터링 패러다임, 시퀀셜 추천 

공부사진 


14일차 후기


열심히 듣자~! 

 

 

 

 

본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다.

https://bit.ly/48sS29N