基本信息
- 項(xiàng)目名稱:
- 使用遺傳規(guī)劃檢測(cè)鏈接作弊
- 小類:
- 信息技術(shù)
- 簡(jiǎn)介:
- 鏈接作弊技術(shù)通過欺騙手段操作網(wǎng)頁間的鏈接結(jié)構(gòu)圖擾亂超鏈接結(jié)構(gòu)分析算法來增加某些網(wǎng)頁的重要性,使其獲得比實(shí)際應(yīng)得更高的排序值,從而在搜索引擎結(jié)果中排在更加靠前的位置。本文提出根據(jù)已有的鏈接特征使用遺傳規(guī)劃產(chǎn)生新的特征,并用這些新的特征作為分類器的輸入來檢測(cè)鏈接作弊。另外,多個(gè)分類器的集成能取得更好的分類性能,本文又提出使用遺傳規(guī)劃集成多個(gè)不同類型的分類器來檢測(cè)鏈接作弊。
- 詳細(xì)介紹:
- 鏈接作弊技術(shù)通過欺騙手段操作網(wǎng)頁間的鏈接結(jié)構(gòu)圖擾亂超鏈接結(jié)構(gòu)分析算法來增加某些網(wǎng)頁的重要性,使其獲得比實(shí)際應(yīng)得更高的排序值,從而在搜索引擎結(jié)果中排在更加靠前的位置。這嚴(yán)重降低了搜索結(jié)果的質(zhì)量,檢測(cè)鏈接作弊已成為搜索引擎的重要挑戰(zhàn)之一。分類方法可以檢測(cè)出鏈接作弊。對(duì)于分類問題,特征起到很重要的作用,本文提出根據(jù)已有的鏈接特征使用遺傳規(guī)劃產(chǎn)生新的特征,并用這些新的特征作為分類器的輸入來檢測(cè)鏈接作弊。另外,多個(gè)分類器的集成能取得更好的分類性能,本文又提出使用遺傳規(guī)劃集成多個(gè)不同類型的分類器來檢測(cè)鏈接作弊。在WEBSPAM-UK2006數(shù)據(jù)集上的實(shí)驗(yàn)表明,與原有的鏈接特征相比,使用遺傳規(guī)劃產(chǎn)生的特征能大大提高鏈接作弊的分類性能;與經(jīng)典的集成算法Bagging和AdaBoost相比,使用遺傳規(guī)劃能得到分類性能更好的分類器。
作品專業(yè)信息
撰寫目的和基本思路
- 網(wǎng)絡(luò)上的信息呈爆炸式增長,搜索引擎就成了幫助人們發(fā)現(xiàn)其想要信息的重要工具,如Google、Baidu等。在搜索引擎中網(wǎng)頁排名非常重要。任何使某些網(wǎng)頁獲得不應(yīng)有的高排序值的欺騙行為都被稱為網(wǎng)絡(luò)作弊。網(wǎng)絡(luò)作弊嚴(yán)重降低了搜索結(jié)果的質(zhì)量,檢測(cè)網(wǎng)絡(luò)作弊已成為搜索引擎的重要挑戰(zhàn)之一。 我們的工作是使用遺傳規(guī)劃方法識(shí)別鏈接作弊。
科學(xué)性、先進(jìn)性及獨(dú)特之處
- 1、使用遺傳規(guī)劃產(chǎn)生新特征檢測(cè)鏈接作弊 2、使用遺傳規(guī)劃集成異態(tài)分類器檢測(cè)鏈接作弊
應(yīng)用價(jià)值和現(xiàn)實(shí)意義
- 應(yīng)用價(jià)值:應(yīng)用于baidu,google等網(wǎng)絡(luò)搜索引擎,為其檢測(cè)出采用不正當(dāng)手段提高排名的網(wǎng)頁。 現(xiàn)實(shí)意義:通過檢測(cè)鏈接作弊,避免網(wǎng)頁排名作假,使用戶可以得到想要的有用的信息
學(xué)術(shù)論文摘要
- 鏈接作弊技術(shù)通過欺騙手段操作網(wǎng)頁間的鏈接結(jié)構(gòu)圖擾亂超鏈接結(jié)構(gòu)分析算法來增加某些網(wǎng)頁的重要性,使其獲得比實(shí)際應(yīng)得更高的排序值,從而在搜索引擎結(jié)果中排在更加靠前的位置。這嚴(yán)重降低了搜索結(jié)果的質(zhì)量,檢測(cè)鏈接作弊已成為搜索引擎的重要挑戰(zhàn)之一。分類方法可以檢測(cè)出鏈接作弊。對(duì)于分類問題,特征起到很重要的作用,本文提出根據(jù)已有的鏈接特征使用遺傳規(guī)劃產(chǎn)生新的特征,并用這些新的特征作為分類器的輸入來檢測(cè)鏈接作弊。另外,多個(gè)分類器的集成能取得更好的分類性能,本文又提出使用遺傳規(guī)劃集成多個(gè)不同類型的分類器來檢測(cè)鏈接作弊。在WEBSPAM-UK2006數(shù)據(jù)集上的實(shí)驗(yàn)表明,與原有的鏈接特征相比,使用遺傳規(guī)劃產(chǎn)生的特征能大大提高鏈接作弊的分類性能;與經(jīng)典的集成算法Bagging和AdaBoost相比,使用遺傳規(guī)劃能得到分類性能更好的分類器。 關(guān)鍵詞:鏈接作弊;遺傳規(guī)劃;特征產(chǎn)生;分類器集成
獲獎(jiǎng)情況
- 暫無
鑒定結(jié)果
- 暫無
參考文獻(xiàn)
- 暫無
同類課題研究水平概述
- 暫不詳