-
패스트캠퍼스 환급챌린지 25일차 미션 (2월 25일) : 30개 프로젝트로 끝내는 추천시스템 구현 초격차 패키지 강의 후기2024년 패스트 캠퍼스 챌린지 2024. 2. 25. 23:05
강의 내용 Review
📍배운내용📍
- PageRank
- 그래프 조작 실습
👉강의내용👈
PageRank
- 그래프가 갖는 구조적인 정보를 사용해서 단순히 샘플들 간의 독립적인 피처를 사용하는 것이 아닌 연결된 패턴으로 부터 그 구조적인 정보에서 정보를 추출해서 원하는 태스크 수행가능
- 그래프 데이터에 딥러닝 뉴럴 네트워크 적용해서 유저에게 아이템을 추천하는 작동원리를 봄
- 웹페이지의 중요도를 따라 웹페이지를 평가하고 검색 순위의 노출을 결정함
- 구글에서 검색 결과를 노출할때 중요도를 반영하는데 페이지와 페이지 사이를 기어다니며 크롤링 해서 모든 웹페이지의 정보를 구글 인덱스에 저장
- 사용자가 쿼리를 날리면 페이지에 저장된 페이지 컨텐츠와 쿼리의 연관성을 고려해서 여러가지 선호 반영해서 랭킹을 매김
- 구글 검색 결과가 페이지 랭크로 중요도가 반영되어 있어서 연관성 높은 결과가 나옴
- 페이지 랭크를 결정하는 방법은?
- 더 많은 페이지에서 많이 참조된 페이지는 중요한 페이지이다 라는 가정
- 각각의 노드와 엣지로 간주하여 유뱡향 그래프를 그림 이 구조적인 정보를 활용해서 어떤 페이지에 몰려있는지 그림
- 랜덤 워크: 그래프 구조를 확률적으로 보는 관점
- 무작위하게 그래프 위를 걸어다님, 무작위로 루트 노드를 정하고 랜덤하게 이동함
- 링크가 많이 연결된 노드가 가장 갈수있는 높은 경우의 수가 있음
- 즉 연결이 많이 되어있는, 중요한 역할의 노드가 시퀀스에서 자주 등장함
- 웹서퍼가 있을때 페이지 링크를 따라 움직이다가 페이지에 머무를 확률
- 각각의 노드의 중요도를 계산하는 법: 더 많이 참조된 페이지는 높은 중요도를 가짐
- 높은 중요도를 가진 노드에서 낮은 중요도의 노드로 흘러가는 듯한 모습, 중요도를 흘려보냄 , out link의 개수 만큼 중요도가 분산되어서 파급됨
- 받는 입장에서는 얼만큼 받는 지 계산 해야함 : in link의 개수만큼 중요도 더해짐
- 확률적 인접행렬로 표현 가능: i와 j가 있을때 칼럼의 합이 1이 될수 있도록 만드는 것
- 계속 곱해서 페이지 랭크의 값이 수렴 값이 도달 할때까지 반복해 중요도 벡터를 구함
- spider trap : 들어오는 노드는 있지만 나가는 노드가 없고 계속 돌때, 끼리끼리 자꾸 주고 받을때는 수렴하지 못하고 진동발산함
- dead end: 막다른 정점: 들어오는 엣지는 있지만 나가는 엣지는 없음, 0으로 수렴함
- Random Teleport로 해결가능, 특정활률을 따라서 아무 노드로 이동, 값이 어떻게든 업데이트 되도록 해결해줌
- 구글 메트릭스는 인접행렬에 작은 확률값을 균일하게 갖도록 반영함으로 구조적인 확률과 랜덤 텔레포테이션의 값을 더해서 사용함
공부사진
25일차 후기
다 썼는데 날라가서 다시 썼다 하항.. ㅠㅠ
오늘도 많이 공부를 못했는데 열심히 하자
본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다.
'2024년 패스트 캠퍼스 챌린지' 카테고리의 다른 글