基于文本理解的推薦系統(tǒng)
作者:葛蘇昱 電子工程系
指導(dǎo)老師:黃永峰教授 電子工程系
關(guān)鍵詞:文本挖掘,推薦系統(tǒng),用戶建模
摘要
本項(xiàng)目旨在從商品用戶相關(guān)的文本信息中學(xué)習(xí)出精確的商品用戶表示,從而更好進(jìn)行個(gè)性化推薦。方法上,不同于傳統(tǒng)的矩陣分解,該項(xiàng)目通過對(duì)原始文本的語義建模,有效避免了矩陣稀疏性和冷啟動(dòng)問題。針對(duì)文本和交互信息的噪聲問題,我們采用自注意力機(jī)制對(duì)一句話中的單詞進(jìn)行上下文編碼,實(shí)現(xiàn)了自動(dòng)降噪。另外,項(xiàng)目還為推薦任務(wù)引入更多的信息,如利用用戶的反饋信息來區(qū)別不同商品對(duì)興趣建模的重要程度,利用圖交互信息引入用戶或商品之間的相似性等。我們?cè)诖笠?guī)模的真實(shí)數(shù)據(jù)上進(jìn)行了大量實(shí)驗(yàn),取得了一定的推薦效果提升。
項(xiàng)目背景
互聯(lián)網(wǎng)上天然存在著海量用戶和商品相關(guān)信息,它們反映商品屬性,隱含用戶偏好,且很多屬于非結(jié)構(gòu)化文本數(shù)據(jù)(新聞內(nèi)容,商品描述,用戶評(píng)論等)。因此,本項(xiàng)目旨在從商品用戶相關(guān)的文本信息中學(xué)習(xí)出精確的商品用戶表示,從而更好進(jìn)行個(gè)性化推薦。
圖1 用于推薦任務(wù)的文本信息
關(guān)鍵技術(shù)
結(jié)合可靠性感知的商品推薦:學(xué)習(xí)用戶表示時(shí),自動(dòng)給予可靠性高的文本更大權(quán)重
圖2 結(jié)合可靠性感知的商品推薦
圖表示增強(qiáng)的新聞推薦:以交互圖中的鄰居信息彌補(bǔ)交互稀疏,學(xué)習(xí)更加豐富的用戶與新聞表示
圖3圖表示增強(qiáng)的新聞推薦
項(xiàng)目成果
結(jié)合可靠性感知的商品推薦:
圖4亞馬遜數(shù)據(jù)集商品推薦效果對(duì)比
圖表示增強(qiáng)的新聞推薦:
圖5微軟新聞數(shù)據(jù)集推薦效果對(duì)比