基本信息
- 項(xiàng)目名稱:
- Danaus網(wǎng)絡(luò)輿情分析系統(tǒng)
- 小類:
- 信息技術(shù)
- 大類:
- 科技發(fā)明制作A類
- 簡介:
- Danaus系統(tǒng)通過對(duì)熱點(diǎn)問題和重點(diǎn)領(lǐng)域比較集中的網(wǎng)頁、論壇、博客等各類信息,進(jìn)行24小時(shí)監(jiān)控匯集、分類、整合、篩選等,使政府即時(shí)地了解社情民意,使企業(yè)更好地了解受眾對(duì)其產(chǎn)品、服務(wù)、綜合競爭實(shí)力以及公司形象、聲譽(yù)的評(píng)價(jià)和認(rèn)知情況。
- 詳細(xì)介紹:
- 本產(chǎn)品Danaus 取自王蝶英文學(xué)名 Danaus plexippus。王蝶是世界上嗅覺最靈敏的動(dòng)物,本項(xiàng)目也要對(duì)負(fù)面消息保持靈敏的洞察。自動(dòng)從互聯(lián)網(wǎng)上發(fā)現(xiàn)尚未流傳開、但可能即將引發(fā)民眾關(guān)注、并大范圍轉(zhuǎn)載、傳播的負(fù)面信息。Danaus通過對(duì)熱點(diǎn)問題和重點(diǎn)領(lǐng)域比較集中的網(wǎng)頁、論壇、博客等各類信息,進(jìn)行24小時(shí)監(jiān)控匯集、分類、整合、篩選等,使政府即時(shí)地了解社情民意,使企業(yè)更好地了解受眾對(duì)其產(chǎn)品、服務(wù)、綜合競爭實(shí)力以及公司形象、聲譽(yù)的評(píng)價(jià)和認(rèn)知情況。其特點(diǎn)是能迅速識(shí)別新聞熱點(diǎn)和突發(fā)事件,第一時(shí)間掌握網(wǎng)絡(luò)輿論的傳播方式和傳播導(dǎo)向,實(shí)時(shí)監(jiān)控與企業(yè)和政府相關(guān)的社會(huì)輿論情況和其他網(wǎng)絡(luò)環(huán)境信息,密切監(jiān)控公司行業(yè)競手的動(dòng)態(tài)走向,并對(duì)此進(jìn)行傾向性分析與統(tǒng)計(jì),生成輿情監(jiān)測數(shù)據(jù)報(bào)告,預(yù)測事態(tài)發(fā)展走向。用戶可通過瀏覽器瀏覽監(jiān)測到的消息,根據(jù)指定條件對(duì)熱點(diǎn)話題、傾向性進(jìn)行查詢,從而進(jìn)行信息反饋、解決突發(fā)事件避免影響擴(kuò)大等。
作品專業(yè)信息
設(shè)計(jì)、發(fā)明的目的和基本思路、創(chuàng)新點(diǎn)、技術(shù)關(guān)鍵和主要技術(shù)指標(biāo)
- 網(wǎng)絡(luò)輿情的及時(shí)監(jiān)測和分析已經(jīng)成為相關(guān)單位重要的工作之一,但面對(duì)如此龐大的互聯(lián)網(wǎng)以及每天數(shù)以萬計(jì)的信息量,單憑人工作業(yè)很難做到及時(shí)有效,工作成本也難以控制。借助信息技術(shù)手段對(duì)網(wǎng)絡(luò)輿情進(jìn)行有效的分析,第一時(shí)間為相關(guān)單位提供決策支持。 關(guān)鍵技術(shù)包括:中文語段情感分析技術(shù)、海量數(shù)量檢索分析技術(shù)等。 主要技術(shù)指標(biāo)有:情感判斷的準(zhǔn)確性,信息獲取的速度。
科學(xué)性、先進(jìn)性
- 作品采用最大熵模型進(jìn)行情感分析。最大熵原理是在1957年由E. T. Jaynes提出的,其主要思想是,在只掌握關(guān)于未知分布的部分知識(shí)時(shí),應(yīng)該選取符合這些知識(shí)但熵值最大的概率分布。因?yàn)樵谶@種情況下,符合已知知識(shí)的概率分布可能不止一個(gè)。我們知道,熵定義的實(shí)際上是一個(gè)隨機(jī)變量的不確定性,熵最大的時(shí)候,說明隨機(jī)變量最不確定。換句話說,也就是隨機(jī)變量最隨機(jī),對(duì)其行為做準(zhǔn)確預(yù)測最困難。從這個(gè)意義上講,那么最大熵原理的實(shí)質(zhì)就是,在已知部分知識(shí)的前提下,關(guān)于未知分布最合理的推斷就是符合已知知識(shí)最不確定或最隨機(jī)的推斷,這是我們可以做出的唯一不偏不倚的選擇,任何其它的選擇都意味著我們增加了其它的約束和假設(shè),這些約束和假設(shè)根據(jù)我們掌握的信息無法做出。 該理論經(jīng)過實(shí)踐應(yīng)用,其具備科學(xué)性與先進(jìn)性。
獲獎(jiǎng)情況及鑒定結(jié)果
- 2010年5月 北京 全??萍甲髌犯傎悺榜T如杯”一等獎(jiǎng) 2009年 獲第三屆國家大學(xué)生創(chuàng)新性實(shí)驗(yàn)計(jì)劃支持 項(xiàng)目經(jīng)費(fèi)9000元 2010年 順利通過第三屆國家大學(xué)生創(chuàng)新性實(shí)驗(yàn)計(jì)劃結(jié)題驗(yàn)收
作品所處階段
- 實(shí)驗(yàn)室階段逐步商用階段
技術(shù)轉(zhuǎn)讓方式
- 無
作品可展示的形式
- 現(xiàn)場演示、視頻、圖片
使用說明,技術(shù)特點(diǎn)和優(yōu)勢,適應(yīng)范圍,推廣前景的技術(shù)性說明,市場分析,經(jīng)濟(jì)效益預(yù)測
- 市場分析: 通過大量的調(diào)查我們可以發(fā)現(xiàn)Danaus有著十分廣闊的市場前景和使用價(jià)值。Danaus研發(fā)團(tuán)隊(duì)致力于產(chǎn)品的創(chuàng)新和功能升級(jí),將會(huì)把目前最好的輿情監(jiān)測系統(tǒng)呈現(xiàn)給大家,疾風(fēng)知?jiǎng)挪?,板蕩識(shí)誠臣,相信在您經(jīng)過了為輿論所累的日子時(shí),您會(huì)認(rèn)識(shí)到擁有一款最新、最高端、最及時(shí)、最準(zhǔn)確的輿情監(jiān)測系統(tǒng)的必要性。Danaus應(yīng)用的成功案例告訴我們應(yīng)用Danaus 是最正確的選擇。
同類課題研究水平概述
- 在輿情監(jiān)測和分析系統(tǒng)中,一個(gè)重要的環(huán)節(jié)就是文本情感分析,也稱為意見挖掘。文本情感分析的作用對(duì)象是包含人們主觀情感的文本,通過對(duì)文本進(jìn)行處理、分析、歸納和推理,得到文本作者對(duì)待事物主體的感情。情感分析一般分為三個(gè)階段,即情感信息的抽取階段、情感信息的分類階段和情感信息的檢索與歸納階段。 1 情感信息抽取 情感信息抽取的主要目的是將評(píng)價(jià)詞語、評(píng)價(jià)對(duì)象和觀點(diǎn)持有者等有價(jià)值的信息單元從文本中抽取出來。網(wǎng)絡(luò)中的文本信息對(duì)于人是可讀可分析的,但是對(duì)于機(jī)器來說是不行的。情感信息抽取能將文本中的主要情感信息單元抽取出來,變成機(jī)器可以操作分析的元信息,為下面的情感信息分類和檢索與歸納做基礎(chǔ)。 2 情感信息分類 人們通常在情感信息中包含傾向可以簡單的分為兩種極性,即褒和貶。在抽取完文本的情感信息之后,就要根據(jù)這些元信息來給文本進(jìn)行“褒貶”的分類,也就是情感信息分類。按照文本的粒度不同,可以將情感信息分類分為詞語級(jí)、短語級(jí)、句子級(jí)和篇章級(jí)。 詞語級(jí)和短語級(jí)的情感分類方法主要有基于語料庫和基于詞典兩種方法?;谡Z料庫的詞語、短語判別主要是利用大語料庫的統(tǒng)計(jì)特性,觀察一些現(xiàn)象(轉(zhuǎn)折、遞進(jìn)等)來挖掘語料庫中的詞語、短語并判斷極性?;谠~典的評(píng)價(jià)詞語抽取及判別方法主要是使用詞典中的詞語之間的詞義聯(lián)系來挖掘評(píng)價(jià)詞語。這里的詞典一般是指使用WordNet或HowNet等。 對(duì)于句子級(jí)和篇章級(jí)分類,主要有兩種研究思路,即基于情感知識(shí)和基于特征分類。前一種方法主要是依托現(xiàn)有的情感詞典或領(lǐng)域詞典一級(jí)主管文本中帶有情感極性的組合評(píng)價(jià)單元進(jìn)行計(jì)算,來獲得文本的極性。后一種方法首先對(duì)大量文本進(jìn)行感情傾向標(biāo)記,然后對(duì)這些標(biāo)記過的文本使用不同的算法進(jìn)行學(xué)習(xí),選取大量有意義的特征來進(jìn)行分類。常用的文本分類方法有最大熵、貝葉斯和SVM等。 3 情感信息檢索與歸納 通過情感信息抽取和分類后的結(jié)果并不能直接為用戶所用,還需要針對(duì)用戶提出的需求進(jìn)行檢索和歸納。例如,對(duì)用戶提出的一個(gè)主題進(jìn)行檢索,通過情感信息檢索與分類得到的大量數(shù)據(jù)進(jìn)行歸納,可以得出人們對(duì)與這一主題的傾向性,并將這種傾向性進(jìn)行分類(褒貶等)和分級(jí)(極其、一般等),得到的結(jié)果呈現(xiàn)給用戶。