주어진 Query로 각 Document가 해당 Query에 적합할 확률을 베이지언 룰을 활용하여 계산하는데,
독립가정을 전제로 베이지언 룰을 이용하여, 비연관문서 집합에서 질의가 포함될 확률에 대한
연관 집합에 포함될 확률을 계산하여 문서를 찾는 모델링이다.
장점 : 문서들이 질의에 대하여 적합할 확률의 순서에 내림 차순으로 랭크된다.
단점 : 비연관 문서와 연관 문서 집합의 초기의 결과 집합을 가정해야만 한다.
불린 모델과 같이 가중치가 없어서 색인어의 빈도수에 대한 가중치를 부여할 수가 없다. (오카피 모델에서 적용)
색인어들에 대한 상호 독립 가정을 전제로 한다.
독립가정을 전제로 베이지언 룰을 이용하여, 비연관문서 집합에서 질의가 포함될 확률에 대한
연관 집합에 포함될 확률을 계산하여 문서를 찾는 모델링이다.
장점 : 문서들이 질의에 대하여 적합할 확률의 순서에 내림 차순으로 랭크된다.
단점 : 비연관 문서와 연관 문서 집합의 초기의 결과 집합을 가정해야만 한다.
불린 모델과 같이 가중치가 없어서 색인어의 빈도수에 대한 가중치를 부여할 수가 없다. (오카피 모델에서 적용)
색인어들에 대한 상호 독립 가정을 전제로 한다.
'IT > 검색엔진' 카테고리의 다른 글
1. Boolean retrieval( Introduction, 1.1 An example information retrieval problem) (0) | 2008.12.05 |
---|---|
Introduction to Information Retrieval (스탠포드 IR) (4) | 2008.12.05 |
확장 불리언 모델 (Extended Boolean Model ) (0) | 2008.07.11 |
불리언 모델 (Boolean Model) (0) | 2008.07.10 |
벡터 스페이스 모델 (Vector Space Model, VSM) (1) | 2008.07.09 |