真人性较视频大全免费_二区三区在线电影_一级a性色生活片毛片野味_伦理免费在线观看_亚洲国产日韩欧美综合_亚洲91精品视频_天天综合日日精品桃花_中文字幕无码熟妇在线播放_97超级碰碰碰免费观看_思思国产热久久国产精品

EN

基于集成學(xué)習(xí)方法的煙草葉片氮含量無(wú)人機(jī)高光譜估測(cè)

發(fā)布者: 發(fā)布時(shí)間:2023-08-02

背景

煙草生產(chǎn)是中國(guó)西南地區(qū)農(nóng)業(yè)和農(nóng)村經(jīng)濟(jì)發(fā)展的關(guān)鍵支柱。為了給煙葉質(zhì)量?jī)?yōu)化提供信息支持,減輕煙農(nóng)的勞動(dòng)負(fù)擔(dān),對(duì)快速、準(zhǔn)確、實(shí)時(shí)的葉片氮含量(Leaf nitrogen content, LNC)檢測(cè)方法有很大需求。無(wú)人機(jī)機(jī)載高光譜遙感(Hyperspectral remote sensing, HRS)能夠以非破壞性的方式獲取成像光譜數(shù)據(jù),實(shí)現(xiàn)煙葉LNC的快速獲取。

一般來(lái)說(shuō),可以使用經(jīng)驗(yàn)方法或物理方法建立模型,或者兩者相結(jié)合,以實(shí)現(xiàn)目標(biāo)性狀的反演。為了解決單個(gè)反演方法的異質(zhì)性,一些學(xué)者提出了作物表型性狀估計(jì)的集成學(xué)習(xí)框架。與試圖從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)一個(gè)假設(shè)的普通機(jī)器學(xué)習(xí)方法不同,集成方法試圖構(gòu)建一組假設(shè)并將它們組合起來(lái)使用。集成學(xué)習(xí)的思想是結(jié)合幾種不同的方法來(lái)增強(qiáng)輸入的多樣性,以挖掘更多的數(shù)據(jù)特征,從而提高模型的整體性能。

本研究旨在建立一種準(zhǔn)確有效的模型,利用無(wú)人機(jī)機(jī)載高光譜圖像估計(jì)煙草LNC。研究中測(cè)試了幾種基于三種集成學(xué)習(xí)策略的典型算法,包括隨機(jī)森林(RF)回歸、自適應(yīng)增強(qiáng)(Adaboost)回歸和堆疊回歸。此外,我們選擇了*常用的偏*小二乘回歸(PLSR)作為基準(zhǔn)模型。主要?jiǎng)?chuàng)新點(diǎn)有:(1)研究了無(wú)人機(jī)機(jī)載HRS在煙草LNC估算中的潛力;(2)評(píng)估了不同集成學(xué)習(xí)策略(如bagging、boosting和stacking)下模型的性能;(3)探索基于堆疊策略提高模型預(yù)測(cè)精度的可行方法。

試驗(yàn)設(shè)計(jì)

江蘇大學(xué)趙春江教授團(tuán)隊(duì)利用Gaiasky-Mini-VN高光譜相機(jī)(江蘇雙利合譜公司)獲取了研究區(qū)內(nèi)不同氮處理下煙草冠層的高光譜影像,其波段范圍為400 ~ 1000 nm,波段數(shù)為256。各類地物的光譜曲線如圖1所示。在整個(gè)田間試驗(yàn)過(guò)程中,每約20天采集一次冠層圖像,從移栽后35天開(kāi)始,一直持續(xù)到收獲。

影像獲取后,第一步,利用ExG去除背景,并提取平均反射率。第二步,利用連續(xù)投影算法(SPA)進(jìn)行數(shù)據(jù)降維。第三步,建立LNC估計(jì)模型,研究中選擇了*常用的PLSR作為基準(zhǔn)模型(圖1)。此外,采用集成學(xué)習(xí)方法來(lái)完成上述相同的回歸任務(wù)。集成學(xué)習(xí)框架下有三種建模策略,即bagging、boosting和stacking。本研究以決定系數(shù)(R2)、均方根誤差(RMSE)和平均絕對(duì)百分比誤差(MAPE)作為評(píng)價(jià)指標(biāo)。

圖1 本研究主要步驟流程圖

 

結(jié)論

本研究對(duì)全波段高光譜反射率數(shù)據(jù)進(jìn)行主成分分析(PCA),提取對(duì)LNC變化更敏感的主成分(PC)。如圖2所示,選取前80個(gè)PC進(jìn)行顯示,當(dāng)主成分?jǐn)?shù)為4、6、7時(shí),累積方差貢獻(xiàn)率(AVCR)分別超過(guò)99.5%、99.8%、99.9%。我們選擇SPA作為二次降維算法。與PCA不同,SPA可以通過(guò)選擇對(duì)LNC變化更敏感的變量來(lái)降低數(shù)據(jù)維度,*終保留了15個(gè)波段(圖3)。

圖2 前7個(gè)PC貢獻(xiàn)了超過(guò)99.9%的信息

圖3 選擇的15個(gè)波段

從圖4可以看出,PLSR的R2相對(duì)較低,但訓(xùn)練集與測(cè)試集之間的差距較小。由于PLSR結(jié)合了PCA和MLR。在這里,我們也給出了MLR的預(yù)測(cè)結(jié)果,訓(xùn)練集和測(cè)試集之間的差距也很?。▓D4c、4d)。結(jié)果表明,訓(xùn)練良好的MLR模型具有良好的穩(wěn)定性,樣本分布均勻,同時(shí)也證明了我們的數(shù)據(jù)集劃分是合理的。

圖4g – 4p顯示了集成學(xué)習(xí)方法的結(jié)果,包括RF、Adaboost和堆疊模型。RF和Adaboost都是基于決策樹(shù)回歸(DTR),為了避免過(guò)擬合,我們將max_dept的值設(shè)置為5。DTR的預(yù)測(cè)結(jié)果如圖4e和圖4f所示。對(duì)于堆疊模型,我們采用雙層結(jié)構(gòu),MLR和DTR模型(即stacking – 1)作為第一層的基估計(jì)器,MLR作為第二層的元估計(jì)器。結(jié)果表明,stacking - 3模型預(yù)測(cè)效果*好。與DTR模型在測(cè)試集上的預(yù)測(cè)結(jié)果相比,stacking - 1模型得到了顯著增強(qiáng),但相較于SPA-MLR改進(jìn)幅度較小。結(jié)果表明,疊加策略可以傳遞基估計(jì)器的優(yōu)點(diǎn)。通過(guò)組合多個(gè)模型來(lái)挖掘更有價(jià)值的數(shù)據(jù)特征。在圖4m - 4p中也可以看到類似的現(xiàn)象。通過(guò)將已經(jīng)訓(xùn)練好的模型添加到堆疊框架的第一層,可以發(fā)現(xiàn)在最終表現(xiàn)上也有逐漸的改善。當(dāng)添加RF模型時(shí)(stacking – 2),測(cè)試集上的R2不僅從0.710提高到0.743,而且超過(guò)了RF本身的R2值,RMSE值也有小幅下降。當(dāng)Adaboost模型被添加時(shí)(stacking – 3),與stacking – 2相比,準(zhǔn)確度只有輕微的提高。

綜上所述,stacking - 3模型的R2和RMSE最高(0.745, 4.824 mg/g),Adaboost模型的MAPE最?。?7.56%)。原因可能是堆疊方法可以從不同的模型中提取更多可用的數(shù)據(jù)特征。由于數(shù)據(jù)噪聲的存在,模型在數(shù)據(jù)特征上往往表現(xiàn)不同。堆疊法可以提取各模型中表現(xiàn)較好的特征,丟棄較差的特征,有效地優(yōu)化預(yù)測(cè)結(jié)果,提高最終的預(yù)測(cè)精度。Adaboost模型可以根據(jù)每個(gè)基估計(jì)器的預(yù)測(cè)誤差調(diào)整其權(quán)重。錯(cuò)誤率小的基估計(jì)器在最終結(jié)果中占有較大的權(quán)重。因此,Adaboost模型得到最小的MAPE。對(duì)于RF,基估計(jì)量相互獨(dú)立,最終結(jié)果是所有基估計(jì)量的簡(jiǎn)單平均值,因此RF模型更容易受到異常值的干擾。

圖4 訓(xùn)練集和測(cè)試集下不同模型性能比較

進(jìn)一步分析每個(gè)基估計(jì)器對(duì)最終結(jié)果的貢獻(xiàn)。我們首先選擇已經(jīng)訓(xùn)練好的RF和Adaboost模型作為基估計(jì)器(圖5a、b)。stacking - 4的綜合性能優(yōu)于RF。將DTR和MLR分別加入到stacking - 4模型中,得到stacking - 5和stacking - 6模型。結(jié)果如圖5c、f所示。stacking - 5和stacking - 6模型之間存在非常小的差異。同時(shí),stacking - 4模型(R2 = 0.876)和stacking - 6模型(R2 = 0.779)在訓(xùn)練集上存在顯著差異。

從某種意義上說(shuō),DTR、RF和Adaboost模型(基于樹(shù)的模型)是同質(zhì)的,因?yàn)镈TR本身是RF(bagging & DTR|)和Adaboost(boosting & DTR)模型的基估計(jì)器。因此,添加DTR不能使模型挖掘更多可用的數(shù)據(jù)特征。這可能就是stacking - 5模型的性能變化不大的原因。對(duì)于線性模型(MLR),它與基于樹(shù)的模型原理是不同的,可以學(xué)習(xí)到一些新特征。雖然在測(cè)試集上的表現(xiàn)略有下降,但在訓(xùn)練集上取得了進(jìn)步。模型的整體穩(wěn)定性得到了提高。綜上所述,RF和Adaboost幾乎貢獻(xiàn)了所有的堆疊精度,然后MLR有助于提高模型的穩(wěn)定性。

最后,對(duì)如何正確配置堆疊模型提出了一些建議。理想情況下,堆疊策略的第一層中的基估計(jì)器應(yīng)該是“準(zhǔn)確和異構(gòu)的”。通過(guò)這種方式,可以學(xué)習(xí)更多有價(jià)值的數(shù)據(jù)特征。此外,為了避免過(guò)擬合,第二層的元估計(jì)器通常選擇一個(gè)簡(jiǎn)單的模型(線性或嶺回歸),該模型使用第一層的輸出作為訓(xùn)練的輸入。

圖5 進(jìn)一步分析堆疊策略

 

作者信息

趙春江,博士,江蘇大學(xué)農(nóng)業(yè)工程學(xué)院教授,博士生導(dǎo)師。

主要研究方向:農(nóng)業(yè)智能系統(tǒng)與精準(zhǔn)農(nóng)業(yè)技術(shù)裝備。

參考文獻(xiàn):

Zhang, M.Z., Chen, T.E., Gu, X.H., Kuai, Y., Wang, C., Chen, D., & Zhao, C.J. (2023). UAV-borne hyperspectral estimation of nitrogen content in tobacco leaves based on ensemble learning methods. Computers and Electronics in Agriculture, 211.

https://doi.org/10.1016/j.compag.2023.108008

服務(wù)網(wǎng)絡(luò)

  • 江蘇雙利合譜科技有限公司

    地址:無(wú)錫市梁溪區(qū)南湖大道飛宏路58-1-108

    電話:13810664973

    郵箱:info@dualix.com.cn

  • 北京辦事處

    地址:北京市海淀區(qū)中關(guān)村大街19號(hào)

    電話:13810664973

    郵箱:info@dualix.com.cn

  • 西安辦事處

    地址:陜西省西安市高新區(qū)科技一路40號(hào)盛方科技園B座三層?xùn)|區(qū)

    電話:13810664973

    郵箱:info@dualix.com.cn

  • 成都

    地址:成都市青羊區(qū)順城大街206號(hào)四川國(guó)際大廈七樓G座

    電話:13810664973

    郵箱:info@dualix.com.cn

  • 深圳辦事處

    地址:深圳市龍華區(qū)民治梅龍路
    電話:13810664973
    郵箱:info@dualix.com.cn
高光譜成像儀/高光譜相機(jī)/高光譜解決方案-江蘇雙利合譜科技有限公司 無(wú)錫市梁溪區(qū)南湖大道飛宏路58-1-108 13810664973 ICP備案號(hào):蘇ICP備2021046114號(hào)-1

銷售直撥:13810664973

回頂