Page Rank 알고리즘을 활용한 Crawling the Large Sites First 알고리즘의 성능 개선
대회명
제67회 전국과학전람회
수상
특상
수상자
박준하
지도교사
박승유
기존의 웹 크롤링 알고리즘 중 성능이 가장 우수하는 평을 받는 알고리즘 ‘PageRank’ 알고리즘이 있다. PageRank 알고리즘은 웹사이트들의 순위를 비교적 정확하고 효율적으로 나열할 수 있으나 웹 사이트의 순위를 비교하기 위해 완전 탐색을 하므로 시간복잡도가 O(N+M)으로 다른 알고리즘들에 비해 시간복잡도가 큰 편이다. 따라서 PageRank의 장점인 ‘정확도’는 최대한 유지하되 시간복잡도(속도)를 효율적으로 만들고자 하였다.