提出一個新匹配的策略使用更加精確和現(xiàn)實的概念以提高過去的基于關(guān)鍵詞的匹配策略。根據(jù)從各個網(wǎng)頁中提取語義概念為每個網(wǎng)頁建立1個概念格子。這樣概念格由雙向聯(lián)想記憶存儲器進行編碼以區(qū)別于過去復雜概念格建立算法。然后提取這些形式概念中與查詢的關(guān)鍵詞相關(guān)的對象與屬性進行匹配操作。
提出一個新匹配的策略使用更加精確和現(xiàn)實的概念以提高過去的基于關(guān)鍵詞的匹配策略。根據(jù)從各個網(wǎng)頁中提取語義概念為每個網(wǎng)頁建立1個概念格子。這樣概念格由雙向聯(lián)想記憶存儲器進行編碼以區(qū)別于過去復雜概念格建立算法。然后提取這些形式概念中與查詢的關(guān)鍵詞相關(guān)的對象與屬性進行匹配操作。在新的匹配模型中,使用的形式概念與自然語義概念相似,并且這些概念被作為文本和網(wǎng)頁表示的基本元素。匹配模型不僅具有理解自然語言文本的能力而且具有學習的能力。其中各個概念權(quán)重是可變的,這個模型可以根據(jù)用戶反饋更新文本的表示,還可以通過學習得到一組有用的概念來幫助檢索。模型中采用的學習策略可以使相關(guān)網(wǎng)頁的相似性得以加強,不相關(guān)網(wǎng)頁的相似性得以削弱。實驗證明,這個新的匹配模型可以使信息檢索的召回率和準確率得以提高。
第十二屆“挑戰(zhàn)杯”省賽作品 省賽一等獎
無