全文信息是指保存在數(shù)據(jù)庫(kù)中的記錄數(shù)據(jù),包括結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。結(jié)構(gòu)化數(shù)據(jù)是具有有限長(zhǎng)度或固定格式的數(shù)據(jù),如字符、日期、數(shù)值、貨幣等。非結(jié)構(gòu)化數(shù)據(jù)也稱為全文數(shù)據(jù),是以不定長(zhǎng)、非固定格式保存的字符型數(shù)據(jù),如簡(jiǎn)歷、簡(jiǎn)介、論文等。全文信息檢索是指從信息數(shù)據(jù)庫(kù)中檢索出相關(guān)信息資料的過(guò)程,其中關(guān)鍵是文檔的索引,即如何將源文檔中的信息以適當(dāng)?shù)男问接涗浀剿饕龓?kù)中。全文檢索系統(tǒng)不僅要求將輸出信息進(jìn)行相關(guān)性排列,還應(yīng)能夠根據(jù)用戶的意圖、興趣和特點(diǎn)自適應(yīng)和智能化地調(diào)整匹配機(jī)制,以獲得用戶滿意的檢索輸出。全文搜索引擎是通過(guò)建立從互聯(lián)網(wǎng)上提取的各個(gè)網(wǎng)站信息的數(shù)據(jù)庫(kù),檢索與用戶查詢條件匹配的相關(guān)記錄,并按一定的排列順序?qū)⒔Y(jié)果返回給用戶的工具。