基本信息
- 項目名稱:
- 基于人類認知心理的遙感圖像空間特征提取技術(shù)
- 小類:
- 信息技術(shù)
- 大類:
- 科技發(fā)明制作B類
- 簡介:
- 遙感技術(shù)在資源環(huán)境動態(tài)監(jiān)測中眾多領(lǐng)域發(fā)揮著舉足輕重的作用,特征提取是遙感圖像分析技術(shù)中的關(guān)鍵技術(shù)之一。然而,現(xiàn)有的方法無法有效地、準確地提取圖像中的重要特征,若提高圖像分類的精度,需要大量的人機交互目視解譯參與信息提取過程,人力資源成本高,工作效率低。 鑒于人類視覺系統(tǒng)對圖像具有強大的理解能力,而且認知神經(jīng)科學和認知心理學分別從細胞水平和心理水平研究了人類的圖像認知過程。本課題根據(jù)人類視覺的啟示,基于認知心理學中注意和知覺階段的重要研究成果,提出了形狀自適應(yīng)鄰域(SAN)的核心概念,將其應(yīng)用于圖像特征提取。實驗表明,基于形狀自適應(yīng)鄰域的方法有效提取了遙感圖像中的光譜特征和空間特征,提高了圖像的分類精度,并可減少遙感圖像解譯中的人力資源投入,可降低數(shù)據(jù)生產(chǎn)的成本。 課題的研究成果包括學術(shù)論文4篇,其中EI收錄2篇,申請國家發(fā)明專利1項,獲國際會議最佳論文獎1項。
- 詳細介紹:
- 遙感技術(shù)在資源環(huán)境動態(tài)監(jiān)測中眾多領(lǐng)域發(fā)揮著舉足輕重的作用,特征提取是遙感圖像分析技術(shù)中的關(guān)鍵技術(shù)之一。然而,現(xiàn)有的方法無法有效地、準確地提取圖像中的重要特征,若想提高圖像分類的精度,需要大量的人機交互目視解譯參與信息提取過程,人力資源成本高,工作效率低。 鑒于人類視覺系統(tǒng)對圖像具有強大的理解能力,而且認知神經(jīng)科學和認知心理學分別從細胞水平和心理水平研究了人類的圖像認知過程。本課題根據(jù)人類視覺的啟示,基于認知心理學中注意和知覺階段的重要研究成果,提出了形狀自適應(yīng)鄰域(SAN)的核心概念,它不僅可提取出圖像中色調(diào)、紋理和形狀特征,并將其應(yīng)用于遙感圖像分類。實驗表明,基于形狀自適應(yīng)鄰域的方法有效提取了遙感圖像中的光譜特征和空間特征,并提高了圖像的分類精度。與此同時,研究還對有關(guān)參數(shù)進行了定量分析,對視野窗口的大小、像素異質(zhì)性閾值等參數(shù)進行了實驗與討論,給出了確定圖像特征的像素異質(zhì)性閾值確定之經(jīng)驗曲線,以提高本方法在實際應(yīng)用中的效果。通過本方法的特征提取過程,可減少遙感圖像解譯中人力資源的投入,降低數(shù)據(jù)生產(chǎn)的成本。 課題的研究成果包括學術(shù)論文4篇,其中EI收錄2篇,申請國家發(fā)明專利1項,獲國際會議最佳論文獎1項。
作品專業(yè)信息
設(shè)計、發(fā)明的目的和基本思路、創(chuàng)新點、技術(shù)關(guān)鍵和主要技術(shù)指標
- 目前,遙感應(yīng)用所采用的遙感圖像分析仍以目視解譯為主,需大量的人工參與,耗費人力資源,使成本大大增加。究其原因,目視解譯過程實為人類視覺發(fā)揮了主要作用,它調(diào)動了人類視覺系統(tǒng)中視覺信息處理的巨大優(yōu)勢。 作品設(shè)計的目的是,從人類視覺認知的特點出發(fā),按照視覺心理學中的注意階段和知覺階段的有關(guān)特征,設(shè)計了圖像處理的方法與技術(shù),用于遙感圖像處理的空間特征提取,并替代部分人機交互的任務(wù),從而減少遙感圖像解譯過程中的人力資源的投入,降低數(shù)據(jù)生產(chǎn)的成本。 基本思路:首先,分析了認知神經(jīng)科學中視覺信息在大腦皮層的傳遞過程,及認知心理學中視覺信息處理的心理過程,提出了形狀自適應(yīng)鄰域(SAN)的核心概念;然后,采用變異函數(shù)及各種形狀描述算子對SAN進行紋理和形狀特征提取,并通過形狀有效性對形狀特征進行約束。同時,對SAN的視野窗口和異質(zhì)性閾值兩個參數(shù)進行定量分析;最后,通過特征融合方法得到整合特征。 主要創(chuàng)新點包括:1)將視覺心理的注意、知覺階段的特征與圖像特征提取技術(shù)相結(jié)合;2)提出了基于視覺認知心理學的遙感圖像的形狀自適應(yīng)鄰域確定方法:一是提出了應(yīng)用顏色特征差異;二是像素異質(zhì)性進行形狀自適應(yīng)鄰域的確定的方法,并對像素異質(zhì)性的閾值進行了定量分析,給出了異質(zhì)性閾值確定的經(jīng)驗曲線;3)首次將基于形狀自適應(yīng)鄰域的遙感圖像特征提取應(yīng)用于廣州市番禺區(qū)的土地利用類型分類中,對分類的結(jié)果進行了精度評估。 主要技術(shù)指標有:像素異質(zhì)性閾值、分類總體精度和Kappa系數(shù)等。
科學性、先進性
- 根據(jù)人類視覺的啟示,基于認知心理學中注意和知覺兩個階段的研究成果,提出了形狀自適應(yīng)鄰域(SAN)的核心概念,并對SAN確定過程中的像素異質(zhì)性閾值進行定量分析。將SAN應(yīng)用于圖像特征提取,通過SAN中像素之間的自相關(guān)性,著重分析其紋理和形狀等空間特征。 從方法論的角度看,與傳統(tǒng)的特征提取方法相比較,本作品在源于認知心理學和神經(jīng)科學的有關(guān)研究成果,采用了一種基于新的理論體系進行圖像特征提取的方法,將人類視覺心理學中的注意、知覺階段的成果應(yīng)用于圖像特征提取,包括:注意理論中的過濾器模型;知覺階段特征提取和整合的理論等,使其可更科學、更準確地提取遙感圖像中的地物特征,并對提高遙感圖像自動分類和識別的精度提供重要的理論基礎(chǔ)和實用價值。 實驗表明,與傳統(tǒng)的方法相比,基于形狀自適應(yīng)鄰域的方法可有效提取遙感圖像中的光譜特征和空間特征(紋理特征和形狀特征),提高了遙感圖像的分類精度,總體精度為0.96873。這將可以減少目視解譯的工作量,從而降低人力資源成本。
獲獎情況及鑒定結(jié)果
- 本作品相關(guān)的技術(shù)已發(fā)表了四篇論文,其中:1)《一種基于形狀自適應(yīng)鄰域的遙感圖像特征提取新方法》(英文)獲得了第29屆亞洲遙感會議最佳論文獎;2)《基于形狀自適應(yīng)鄰域的遙感圖像分類》(英文)已被EI收錄;3)《借鑒人類認知特點的城市遙感信息提取》(英文)被EI和ISTP收錄;4)《認知科學與遙感圖像特征提取》發(fā)表于第二屆珠江三角洲區(qū)域環(huán)境遙感研討會。 此外,本作品已申請了國家發(fā)明專利一項:《一種基于形狀自適應(yīng)鄰域的遙感圖像特征提取方法》,其申請?zhí)枮椋?00910038437.3 在第十屆“挑戰(zhàn)杯”廣東大學生課外學術(shù)科技作品競賽中獲得一等獎。
作品所處階段
- 中試階段:目前本作品正在廣州奧格智能科技有限公司進行試驗,應(yīng)用于廣州市番禺區(qū)土地利用動態(tài)監(jiān)測應(yīng)用中。
技術(shù)轉(zhuǎn)讓方式
- 1)本技術(shù)的軟件;2)軟件著作權(quán);3)國家發(fā)明專利
作品可展示的形式
- 1)現(xiàn)場演示;2)圖片
使用說明,技術(shù)特點和優(yōu)勢,適應(yīng)范圍,推廣前景的技術(shù)性說明,市場分析,經(jīng)濟效益預(yù)測
- 借鑒人類認知心理中注意和知覺兩個階段的優(yōu)秀認知能力,設(shè)計了基于形狀自適應(yīng)鄰域的遙感圖像特征提取方法的理論體系及實現(xiàn)方法,模擬了人類視覺系統(tǒng)對視覺信息處理的功能,使圖像處理具有了“人類智能”的特點和優(yōu)勢。 具有以下推廣前景:1)適應(yīng)范圍廣。通過合理設(shè)置視野窗口和異質(zhì)性閾值兩個參數(shù),適用于低、中、高空間分辨率和高光譜遙感圖像特征提?。?)對人工目視解譯參與的依賴性降低,從而減少人力的投入,降低數(shù)據(jù)生產(chǎn)的成本;3)提供模塊化程序接口,二次開發(fā)簡單、易操作,并可與現(xiàn)有的遙感圖像處理軟件及系統(tǒng)能實現(xiàn)無縫銜接。 與同類產(chǎn)品相比,具有以下優(yōu)勢:1)輸入輸出均為通用格式(GeoTiff),與傳統(tǒng)軟件無縫銜接;2)提供軟件模塊(應(yīng)用程序接口,API),便于二次開發(fā)的調(diào)用,而且可集成到商業(yè)化遙感圖像處理軟件中;3)是一項自主創(chuàng)新的技術(shù)。在試驗階段,采用本作品進行特征提取,再用商用軟件進行分類,可有效減少目視解譯的工作量,從預(yù)處理到滿足需求的分類精度,工作效率可提高42.8%左右。
同類課題研究水平概述
- 遙感圖像特征提取是對圖像進行光譜特征和空間特征進行提取的過程,其中空間特征包括:紋理特征和形狀特征,它們可用于遙感圖像的分類、目標識別等應(yīng)用。經(jīng)典的遙感圖像特征提取方法可分為三類:1)對單個像素進行特征提取的方法。這類對象只能提取遙感圖像的光譜特征。2)對像素的規(guī)則鄰域進行特征提取的方法。該類方法可提取鄰域內(nèi)像素的紋理特征,但不能提取相關(guān)形狀特征。3)對圖像的分塊進行特征提取的方法。該方法先對遙感圖像進行分塊,認為只要每塊足夠小,則可認為塊內(nèi)均屬同種地物,且可分析其紋理特征,但當邊緣信息被錯分時,無法剔除。據(jù)此,現(xiàn)有方法存在的問題是無法完整地提取圖像中的光譜、紋理和形狀特征。 從人類認知的角度看,借助人類視覺優(yōu)勢以提高遙感圖像處理效果的思路已受到了越來越多的關(guān)注,而最早將這種思路付諸實現(xiàn)的是德國的易康(eCognition)軟件,其主要技術(shù)是面向?qū)ο蟮倪b感圖像分析技術(shù),從把圖像分割為眾多對象開始,采用一整套異于傳統(tǒng)處理方法的流程,并取得了優(yōu)于傳統(tǒng)方法的處理效果。目前,各大主流的商用遙感圖像處理軟件也相繼添加了自己的面向?qū)ο蠓治瞿K,如:ENVI的FX模塊,ERDAS的Objective模塊及PCI的FeatureOjex模塊。然而,這些技術(shù)存在的問題在于,它們主要是針對人類視覺中對象分析方法(如:對象識別后的推理過程),并沒有從認知心理學的角度分析人類視覺中的注意機制和知覺機制,而這兩個層次的功能正是人類視覺優(yōu)勢的重要體現(xiàn),認知心理學家也對這兩個階段分別做了深入的研究,并提出了一些有價值的研究理論。目前,面向?qū)ο蠓治黾夹g(shù)尚未很好地利用人類視覺功能中底層功能的優(yōu)勢。 然而,這些軟件仍然存在兩個方面的問題:1)普及性不高。盡管各大主流商用產(chǎn)品都已添加了面向?qū)ο蠓治龅哪K,但由于生產(chǎn)成本、技術(shù)人員培訓等問題,多數(shù)單位仍然使用舊版本的圖像處理軟件。對全新的面向?qū)ο蠓治鲕浖╡Cognition) 的引進,更是只有部分有條件的單位才能做到,絕大多數(shù)的中、小型單位或企業(yè)則未能購買。同時,缺乏熟悉此項技術(shù)的人員也是大部分企業(yè)沒有使用新軟件的重要原因。因此,傳統(tǒng)的遙感圖像處理方式仍然占主流市場。2)自主知識版權(quán)少。目前主流的商用軟件均是國外的產(chǎn)品,缺少具有自主知識產(chǎn)權(quán)的面向?qū)ο蠓治龅能浖a(chǎn)品。