'검색'에 해당되는 글 1건

  1. 2009.12.06 Block-based Web Search

Block-based Web Search

공부 2009.12.06 15:41
며칠전 ADM수업시간에 MSRA에서 오신 분이 웹서치에 대한 강연을 해주셨는데,
그중에서 Block-base 서치라는 개념이 참 맘에 들었다.

기존의 페이지랭크 알고리즘을 directed weighted graph로 본다면
그 그래프에서의 노드는 페이지 단위였는데
block-base서치에서는 노드를 페이지 단위가 아니라, 페이지를 몇개의 블록으로 나눠서
블록단위로 처리를 하는것이다.

(왼쪽의 페이지를 오른쪽과 같이 블록단위로 나눈다.)


이렇게 블록으로 나누면 각 블록이 있는 위치에 따라서 그 블록의 중요도를 어느정도 책정할 수 있으며, 중요한 블록에서 링크된 블록은 더 중요한 블록으로 취급되게 된다.

기존의 페이지단위 검색에서는 블로그에 올려진 서로 다른 주제의 글이 한 페이지에 나와있다는 이유만으로 연관이 되거나, header또는 footer에 있는 내용이 본문과 섞여서 검색결과에 나오는 경우가 있었는데, 그러한 노이즈를 제거할 수 있는 비교적 간단하면서도 실용적인 방법인것 같다.

그런 극단적인 노이즈의 제거 뿐만이 아니라 일반적인 검색결과의 랭킹에도 좀 더 좋은 영향을 미칠 수 있지 않을까 하는 생각도 들고.

최대 이슈중 하나는 저 블록을 어떻게 나누고, 그 나뉜 블록에 어떻게 가중치를 줄까인데,
그 부분에서는 머신러닝쪽 테크닉들을 활용하는것 같더라.


ref: http://research.microsoft.com/en-us/people/jrwen/block-based_search.pdf

'공부' 카테고리의 다른 글

Google Summer of Code2010 & CGAL  (0) 2010.03.30
O/R mapping  (0) 2010.02.26
Laplacian Pyramid on GPU  (1) 2010.01.13
Block-based Web Search  (0) 2009.12.06
오토 레포트  (3) 2009.11.04
Constructive Logic  (3) 2009.09.22
Posted by youknow04
TAG ,


티스토리 툴바