您現(xiàn)在的位置:專(zhuān)區(qū)首頁(yè)>> 優(yōu)秀作品>>作品
【研究意義】酸棗(Ziziphus jujuba var.spinosa)為鼠李科(Rhamnaceae)棗屬(Zizyphus Mill.)小灌木,適應(yīng)性強(qiáng),廣布于華東、華北、西北和東北的向陽(yáng)山坡、荒蕪丘陵和平原,從濕潤(rùn)的東部海濱到干旱的西部荒漠,均能生長(zhǎng)良好[1],酸棗根系發(fā)達(dá),抗旱、耐寒、耐貧瘠能力強(qiáng),具有重要的水土保持作用,是綠化荒山的先鋒樹(shù)種[2]。同時(shí)酸棗仁具有養(yǎng)心補(bǔ)肝、寧心安神、斂汗、生津的藥用價(jià)值,適用于虛煩不眠、驚悸多夢(mèng)、體虛多汗、津傷口渴的人群[3]。有研究表明不同產(chǎn)地的酸棗仁品質(zhì)存在顯著差異,因此,為了保證其來(lái)源的真實(shí)性,探索酸棗產(chǎn)地溯源方法具有重要意義?!厩叭搜芯窟M(jìn)展】目前,有關(guān)酸棗的研究主要集中在化學(xué)成分[4-6]、藥理作用[7]、系統(tǒng)分類(lèi)學(xué)[8]、組織培養(yǎng)[9-11]、酸棗結(jié)構(gòu)特征和抗逆性[12-15]等方面?!颈狙芯壳腥朦c(diǎn)】關(guān)于酸棗種子形態(tài)特征和產(chǎn)地判別的研究尚未見(jiàn)報(bào)道?!緮M解決的關(guān)鍵問(wèn)題】分析不同產(chǎn)地酸棗仁顏色、形態(tài)的特點(diǎn),篩選酸棗產(chǎn)地判別的有效指標(biāo),探索顏色、形態(tài)和現(xiàn)代統(tǒng)計(jì)分析技術(shù)對(duì)中國(guó)酸棗產(chǎn)地溯源的可行性,為酸棗的產(chǎn)地溯源提供新途徑。
表1 四地酸棗樣本數(shù)及采集地點(diǎn)
Table 1 Zizyphus jujube sample number of four places and gathering place
地理分布 樣本數(shù) 采樣點(diǎn)
經(jīng)度 緯度
煙臺(tái) 100 121°37′ 37°21′
贊皇 100 114°26′ 37°39′
銀川 100 105°57′ 38°31′
吐魯番 100 88°49′ 42°47′
1.2 酸棗仁圖像的獲取
按固定的次序和方向?qū)⑺釛椚蕯[放于EPSON掃描儀上,采用600DPI分辨率分別獲取400粒酸棗仁的彩色圖像。
1.3 統(tǒng)計(jì)方法
判別分析是在分類(lèi)確定的條件下,根據(jù)研究對(duì)象的各項(xiàng)特征判別其類(lèi)型歸屬問(wèn)題的一種多變量統(tǒng)計(jì)分析方法。其基本原理是按照一定的判別準(zhǔn)則,建立一個(gè)或多個(gè)判別函數(shù),用研究對(duì)象的大量資料確定判別函數(shù)中的待定系數(shù),并計(jì)算判別指標(biāo),即設(shè)k個(gè)總體G1,G2,…,GK ,希望建立一個(gè)準(zhǔn)則,對(duì)于給定的任意一個(gè)樣本x,依據(jù)這個(gè)準(zhǔn)則能判斷它是來(lái)自哪個(gè)總體。希望建立的判別準(zhǔn)則在某種意義上是最好的,如正確率最高等。
數(shù)據(jù)用Microsoft Excel軟件整理、制表,用Photoshop軟件進(jìn)行圖像處理,SPSS Statistic統(tǒng)計(jì)軟件和DPS數(shù)據(jù)處理系統(tǒng)進(jìn)行分析。
聚類(lèi)分析是通過(guò)數(shù)據(jù)建模簡(jiǎn)化數(shù)據(jù)的一種方法和搜索簇的無(wú)監(jiān)督的學(xué)習(xí)過(guò)程。它也是一種探索性的分析,在分類(lèi)的過(guò)程中,人們不必事先給出一個(gè)分類(lèi)的標(biāo)準(zhǔn),而是從樣本數(shù)據(jù)出發(fā),自動(dòng)進(jìn)行分類(lèi),目的是將性質(zhì)相近的事物歸為一類(lèi),探索各指標(biāo)之間一定的相關(guān)關(guān)系。
驗(yàn)證方法采用回判驗(yàn)證和交叉驗(yàn)證法?;嘏序?yàn)證是根據(jù)判別準(zhǔn)則將樣本依次代入,評(píng)價(jià)判別效果。交叉驗(yàn)證是近年來(lái)逐漸發(fā)展起來(lái)的一種非常重要的判別效果驗(yàn)證技術(shù),將初始采樣分割為k個(gè)子樣本,一個(gè)單獨(dú)的子樣本被保留作為驗(yàn)證模型的數(shù)據(jù),其他k-1個(gè)樣本被用來(lái)訓(xùn)練,交叉驗(yàn)證重復(fù)k次,每個(gè)子樣本驗(yàn)證一次,平均k次的結(jié)果最終得到一個(gè)單一估測(cè)。交叉驗(yàn)證與回判驗(yàn)證相比錯(cuò)分率可能會(huì)增加,但結(jié)果更真實(shí)、客觀,是評(píng)價(jià)判別準(zhǔn)則效能的可靠指標(biāo)。
正確率=正確分組的樣本個(gè)數(shù)/總樣本的個(gè)數(shù),錯(cuò)誤率=錯(cuò)誤分組的樣本個(gè)數(shù)/總樣本的個(gè)數(shù)。
2 結(jié)果與分析
2.1 不同產(chǎn)地酸棗仁顏色、形態(tài)的描述統(tǒng)計(jì)
通過(guò)Photoshop軟件對(duì)酸棗仁圖像進(jìn)行處理得到27個(gè)變量, 從這些變量分布特征看存在一定的差異,為進(jìn)一步進(jìn)行判別分析提供了一定的依據(jù)。從這些變量中選取了幾個(gè)具有代表性的變量:R中值、B中值、RGB中值、灰度最小值,用SPSS軟件處理得到如下直方圖。
圖1 四個(gè)地區(qū)部分變量頻率分布直方圖
Fig 1 Four areas where part of the variable frequency distribution histogram
從b中可以看出每一個(gè)地區(qū)B中值的大小比較分散,整體來(lái)看四個(gè)地區(qū)B中值的集中情況并不相同,說(shuō)明四個(gè)產(chǎn)地酸棗仁在該變量上存在較大的差異;從c中看出煙臺(tái)、贊皇、吐魯番三個(gè)地區(qū)灰度最小值的大小相對(duì)比較集中,而銀川的比較分散,整體來(lái)看四個(gè)地區(qū)這一變量的集中情況比較相近。
2.2 酸棗仁顏色、形態(tài)變量的篩選
得到的27個(gè)變量,經(jīng)SPSS統(tǒng)計(jì)軟件逐步判別篩選得到11個(gè)有效變量,分別為RGB均值(X1)、RGB中值(X2)、R中值(X3)、G均值(X4)、G標(biāo)準(zhǔn)差(X5)、B中值(X6)、明度標(biāo)準(zhǔn)差(X7)、周長(zhǎng)(X8)、高度(X9)、灰度最小值(X10)和灰度均值(X11)
2.3 Fisher判別分析
根據(jù)Fisher判別法對(duì)四地酸棗仁數(shù)據(jù)進(jìn)行分析,在此研究中運(yùn)用非標(biāo)準(zhǔn)化的Fisher判別函數(shù)。此判別函數(shù)系數(shù)由于可以將實(shí)測(cè)的樣本觀測(cè)值直接代入求出判別函數(shù)值,所以該函數(shù)使用起來(lái)比標(biāo)準(zhǔn)化的系數(shù)要方便一些。由表2可知,用貢獻(xiàn)率最大的11個(gè)參數(shù)建立了3個(gè)Fisher判別函數(shù),即:
Y1=-2.854-0.052x1 + 0.069x2 + 0.085x3 + 0.092x4 + 0.343x5-0.269x6-0.266x7 + 0.013x8-0.032x9-0.096x10 + 0.045x11
Y2=-17.494 + 0.66x1-0.182x2 + 0.042x3-0.369x4-0.799x5 + 0.186x6 + 0.876x7-0.011x8 + 0.049x9-0.049x10-0.161x11
Y3=-12.374 + 0.292x1-0.158x2-0.082x3-0.03x4-1.031x5 + 0.017x6 + 1.149x7 + 0.02x8-0.076x9 + 0.496x10-0.081x11
表2 4地酸棗仁的組質(zhì)心
Table 2 The group of center of mass of seed of zizyphus jujube of four palces
地點(diǎn)編碼 函數(shù)
1 2 3
煙臺(tái) 1.177 1.566 -0.612
贊皇 -2.176 0.340 1.229
銀川 2.906 -0.984 0.461
吐魯番 -1.907 -0.922 -1.078
使用Fisher判別函數(shù),可以計(jì)算每個(gè)樣本3維空間的坐標(biāo),然后計(jì)算該點(diǎn)離各中心的距離,距離哪個(gè)類(lèi)中心最近,即屬于該類(lèi)。
圖2 四地酸棗仁函數(shù)1、函數(shù)2判別得分散點(diǎn)圖
Fig 2 Four zizyphus jujube kernel function to scattered point figure 1, 2 discriminant function
圖3 4地酸棗仁函數(shù)三維分布散點(diǎn)圖
Fig 3 Four zizyphus jujube kernel function to the three dimensional distribution scatter plot
2.4 回判驗(yàn)證與交叉驗(yàn)證
回判驗(yàn)證總正確率為90.5%,其中煙臺(tái)正確率最高,為94%,其次是贊皇91%,吐魯番89%,銀川88%。交叉驗(yàn)證總正確率為88.5%。煙臺(tái)正確率最高為92%,其次是銀川88%,贊皇和吐魯番都是87%。
表3 回判驗(yàn)證和交叉驗(yàn)證分類(lèi)結(jié)果表
Table 3 Back and cross validation classification result table
預(yù)測(cè)組
地點(diǎn) 煙臺(tái) 贊皇 銀川 吐魯番 合計(jì)
初始 計(jì)數(shù)(%) 煙臺(tái) 94 1 3 2 100
贊皇 3 91 0 6 100
銀川 10 1 88 1 100
吐魯番 3 8 0 89 100
交叉驗(yàn)證 計(jì)數(shù)(%) 煙臺(tái) 92 1 4 3 100
贊皇 4 87 0 9 100
銀川 10 1 88 1 100
吐魯番 5 8 0 87 100
2.5 聚類(lèi)分析
圖4 酸棗仁11個(gè)有效指標(biāo)的聚類(lèi)圖
Fig 4 Seed of zizyphus jujube kernel clustering figure 11 effective index
采用歐式距離對(duì)四個(gè)地區(qū)酸棗仁基于11個(gè)有效變量進(jìn)行聚類(lèi)分析,聚類(lèi)圖結(jié)果表明,長(zhǎng)度,周長(zhǎng)為一類(lèi);B中值,明度標(biāo)準(zhǔn)差,G標(biāo)準(zhǔn)差為一類(lèi),其中明度標(biāo)準(zhǔn)差和G標(biāo)準(zhǔn)差的關(guān)系最近;灰度最小值,R中值,灰度均值,G均值,RGB中值,RGB均值為一類(lèi),其中RGB中值和RGB均值的關(guān)系最近。
3 討論
生物性狀主要由遺傳因子控制,同時(shí)也受不同環(huán)境因素的影響,大量研究表明,種子顏色形態(tài)的變異程度較小[16],因此本研究側(cè)重于不同環(huán)境對(duì)酸棗種子的影響,通過(guò)對(duì)其顏色、形態(tài)進(jìn)行判別分析,篩選有效指標(biāo),為酸棗的產(chǎn)地溯源提供依據(jù)。
酸棗適應(yīng)性強(qiáng),分布范圍廣,無(wú)論是濕潤(rùn)還是干旱的地理環(huán)境,均可以良好生長(zhǎng)[1]。近年來(lái)酸棗研究集中在其化學(xué)成分[4-6]、藥理作用[7]、結(jié)構(gòu)特征和抗逆性[12-15]等方面,而關(guān)于酸棗種子形態(tài)特征和產(chǎn)地判別方面的研究尚未見(jiàn)報(bào)道。本課題的研究重點(diǎn)在于篩選酸棗產(chǎn)地判別的有效指標(biāo),探索顏色、形態(tài)和現(xiàn)代統(tǒng)計(jì)分析技術(shù)對(duì)我國(guó)酸棗產(chǎn)地溯源的可行性,進(jìn)一步為酸棗的產(chǎn)地溯源提供新途徑。
本次研究采用了Fisher判別、聚類(lèi)分析等方法,并用Photoshop圖像處理軟件,SPSS統(tǒng)計(jì)軟件以及DPS數(shù)據(jù)處理系統(tǒng)等進(jìn)行分析,并用回判驗(yàn)證和交叉驗(yàn)證對(duì)其結(jié)果的正確性進(jìn)行證明。本次研究的酸棗采自于煙臺(tái)、贊皇、銀川、吐魯番四個(gè)地區(qū),具有真實(shí)性,并且對(duì)四個(gè)地區(qū)各100個(gè)酸棗樣本進(jìn)行分析,具有代表性。判別方法使用比較簡(jiǎn)單,考慮數(shù)據(jù)比較周全,能較明確的看出各個(gè)有效指標(biāo)之間的相關(guān)關(guān)系,從而建立了幾個(gè)可靠而穩(wěn)定的判別模型,這幾種分析方法雖然結(jié)果相似,但反映的角度不同,不能相互替代。誤判的原因可能是受到特定環(huán)境的影響,表現(xiàn)出特殊的性狀,造成判別的正確率下降。
經(jīng)本次研究可得到影響酸棗產(chǎn)地判別的11個(gè)有效指標(biāo),并建立了判別酸棗產(chǎn)地溯源的函數(shù)模型,可以判別煙臺(tái)、贊皇、銀川、吐魯番4個(gè)地區(qū),而且為更廣泛地區(qū)的酸棗產(chǎn)地溯源提供新方法。分析酸棗產(chǎn)地溯源的這種方法和思維不僅可用于酸棗,還可用于其他物種的產(chǎn)地溯源,從而對(duì)其形態(tài)特征、生活習(xí)性等有更充分的了解,并可與同一地區(qū)的相似品種進(jìn)行比較分析。此研究主要通過(guò)對(duì)酸棗仁的形態(tài)、顏色數(shù)量化,從而進(jìn)行酸棗的產(chǎn)地溯源,今后還可進(jìn)一步結(jié)合酸棗果實(shí)等指標(biāo)進(jìn)行研究、建模,判斷其來(lái)源地,由此可得出多種方法進(jìn)行酸棗產(chǎn)地溯源,所建模型正確率可能會(huì)更高。
山西師范大學(xué)第八屆“挑戰(zhàn)杯”青年學(xué)生課外學(xué)術(shù)科技作品大賽三等獎(jiǎng)