水稻作為全球主要糧食作物之一,在養(yǎng)活世界人口方面具有重要地位。然而,隨著人口增長和耕地資源減少,提升水稻單位面積產(chǎn)量成為解決糧食安全的重要途徑。在傳統(tǒng)水稻育種過程中,高產(chǎn)品種的篩選依賴人工測量產(chǎn)量和生物量,但這種方法耗時費力、效率低且難以大范圍應(yīng)用。此外,受氣候變化和環(huán)境因素影響,產(chǎn)量差異顯著,增加了高產(chǎn)品種篩選的復雜性。
近年來,隨著無人機(UAV)和高光譜成像技術(shù)的發(fā)展,農(nóng)業(yè)高通量表型檢測成為可能。高光譜成像可以同時獲取作物的光譜和空間信息,實現(xiàn)對生長狀態(tài)、養(yǎng)分水平及倒伏等性狀的無損監(jiān)測和精準評估。然而,單一基于植被指數(shù)或傳統(tǒng)統(tǒng)計模型的方法在動態(tài)環(huán)境下穩(wěn)定性差,無法滿足育種過程中對高精度、快速分類的需求。
蘇軍,福建農(nóng)林大學蛋白組學研究中心,博士生導師
期刊來源:Plant Phenomics
該研究結(jié)合無人機高光譜影像和倒伏特征,利用XGBoost機器學習算法,構(gòu)建水稻產(chǎn)量分類模型。旨在開發(fā)一種低成本、高通量、非破壞性的方法,實現(xiàn)大范圍高產(chǎn)水稻品種的快速篩選,提升水稻育種效率,并為精準農(nóng)業(yè)和農(nóng)業(yè)智能化提供新的技術(shù)手段。
本研究在江蘇省南京市農(nóng)業(yè)試驗基地開展,選取多個水稻品種作為研究對象,數(shù)據(jù)采集時間為水稻灌漿中后期。使用大疆M600 Pro六旋翼無人機作為飛行平臺,搭載江蘇雙利合譜科技有限公司生產(chǎn)的176波段高光譜相機(GaiaSky-Vis&Nir)(圖1(a),a-1)。在測量前,需在直射陽光下校準曝光時間。采集一張白板和兩張黑背景圖像。拍攝白板圖像時,將漫反射標準板垂直于鏡頭前方放置(圖1(a),a-2)。兩張黑背景圖像(圖1(a),a-3和a-4)按照制造商規(guī)范拍攝,分別使用鏡頭蓋關(guān)閉并采用常規(guī)或增加曝光時間的方式獲取。高光譜相機的白板和黑背景曝光時間分別為0.9秒和1.0秒。為進行輻射校準,將反射率分別為20%、40%和60%的參考面板放置在田間,并在圖像處理中作為標準使用(圖1(b))。該高光譜相機的分辨率為960×1057像素,在90米飛行高度下可提供4.5厘米的空間分辨率(圖2(c))。高光譜相機為線傳感器,波長范圍為400至1000 nm,光譜分辨率(半高寬)為3.5 nm,每張圖像的曝光時間為7秒。水稻的光譜曲線與周圍土壤的光譜曲線存在顯著差異(圖1(d))。
圖1:高光譜相機校準與圖像采集。(a) 在陽光下使用標準白板校準曝光時間(a-1),包括拍攝白板圖像(a-2)、暗背景圖像(a-3)以及增加曝光時間后的暗背景圖像(a-4)。(b) 反射率分別為20%、40%和60%的參考反射面板。(c) 圖像采集時無人機飛行高度為90米。(d) 示例樣本區(qū)域及其對應(yīng)的水稻和土壤光譜曲線
采集得到的高光譜影像首先進行了黑白板校正、輻射校正與大氣校正。隨后,剔除了光譜中的噪聲波段,提取感興趣區(qū)域(ROI)的平均光譜反射率,確保所用光譜數(shù)據(jù)準確代表水稻冠層信息。此外,計算了多種常用植被指數(shù)(如NDVI、GNDVI和OSAVI等),為后續(xù)建模提供更加豐富和直觀的作物生長狀態(tài)指標。
為了進一步提高水稻產(chǎn)量分類模型的表現(xiàn),研究結(jié)合了倒伏特征,通過對無人機影像的分析,提取出倒伏程度(輕度、中度、重度)及倒伏位置分布情況。
將經(jīng)過預處理的光譜數(shù)據(jù)、植被指數(shù)以及倒伏特征數(shù)據(jù)整合在一起(圖2),并根據(jù)水稻品系進行標記。進行了兩種分析:品系內(nèi)分析和品系間分析。在品系內(nèi)分析中,從每個品系中隨機選取兩個重復樣本作為訓練數(shù)據(jù),而將第三個重復樣本用作測試數(shù)據(jù)(圖3(a))。在品系間測試中,從每個類別中選擇一個品系作為測試樣本,其余10個品系則被用作訓練樣本??傮w而言,類別之間共有2(A類)×7(B類)×4(C類)=56種排列組合(圖3(b))。為了降低測試誤差并提高驗證方法的可行性,這56種訓練集和測試集均被逐一分析。
圖2:高光譜和RGB圖像處理流程及數(shù)據(jù)集構(gòu)建。從抽穗期獲取的原始圖像經(jīng)過多種失真校正后得到修正數(shù)據(jù)。提取參考光譜,并去除噪聲和背景。在網(wǎng)格單元和后續(xù)感興趣區(qū)域(ROI)選擇后,使用隨機像素計算植被指數(shù)。從成熟期提取的倒伏統(tǒng)計數(shù)據(jù)與光譜數(shù)據(jù)結(jié)合,形成訓練和測試集
圖3:模型建立的樣本組合。圖中展示了用于品系內(nèi)分析(a)和品系間分析(b)的重復樣本和品種排列的示意圖
基于篩選后的特征,研究將水稻樣本按照產(chǎn)量標準分為高產(chǎn)、中產(chǎn)和低產(chǎn)等級,并采用XGBoost(極端梯度提升算法)構(gòu)建產(chǎn)量分類模型。并通過網(wǎng)格搜索方法確定了XGBoost算法的最佳參數(shù)。構(gòu)建了3×3的混淆矩陣來分析預測結(jié)果,并計算了精確率和召回率。
鑒于倒伏標注對于更準確的產(chǎn)量估算具有重要意義,測試是否可以不依賴人工標注,通過自動倒伏表型識別實現(xiàn)準確估算。為獲得足夠的訓練樣本,使用 RGB 相機(成本低于高光譜相機)采集了100 張倒伏圖像和 83 張非倒伏圖像。所有圖像被調(diào)整為統(tǒng)一尺寸(224 × 224)。隨后,從無人機航拍圖像中裁剪出倒伏區(qū)域和非倒伏區(qū)域(ROI),作為訓練數(shù)據(jù)集。最后,我們采用遷移學習、圖像增強技術(shù),并使用基于 ImageNet 預訓練權(quán)重的 ResNet50 模型,結(jié)合 Adam 優(yōu)化器進行模型訓練。模型的批次大?。╞atch size)為 8,學習率為 0.0001,訓練輪數(shù)(epoch)為 30,總迭代次數(shù)為 600。將訓練好的模型應(yīng)用于39 個實驗地塊中 13 個品種的三次重復實驗進行倒伏識別(如圖4所示)。結(jié)果顯示,僅有2個倒伏單元被誤判為非倒伏單元,倒伏識別準確率達到了94.87%,這表明深度學習技術(shù)完全可用于水稻倒伏的自動識別。
圖4. 利用微調(diào)技術(shù)實現(xiàn)水稻倒伏的自動識別。(a) 倒伏檢測模型的訓練數(shù)據(jù),其中包含100張倒伏圖像和83張非倒伏圖像。(b) 來自39個實驗田塊的高光譜數(shù)據(jù)的偽彩色圖像(波段77、50和18)。根據(jù)種植區(qū)域截取感興趣區(qū)域(ROIs),以建立測試數(shù)據(jù)集,其中包含14張倒伏圖像和25張非倒伏圖像。(c) 模型在訓練數(shù)據(jù)上的混淆矩陣。(d) 模型在測試數(shù)據(jù)上的混淆矩陣
對五種機器學習算法進行了測試和比較,這些算法包括LDA(線性判別分析)、高斯核支持向量機(SVM)、AdaBoost、隨機森林(RF)和XGBoost。測試結(jié)果顯示,XGBoost的性能優(yōu)于其他四種方法(圖5)。
圖5:五種分類器(包括LDA、SVM、AdaBoost、RF和XGBoost)的測試結(jié)果
該研究結(jié)合無人機高光譜影像數(shù)據(jù)與水稻倒伏特征,構(gòu)建了基于XGBoost算法的水稻產(chǎn)量分類模型。研究結(jié)果表明,倒伏特征在模型中具有重要作用,單獨使用倒伏特征時模型準確率最高為69.32%,而將高光譜數(shù)據(jù)與倒伏特征結(jié)合后,模型分類準確率顯著提升。通過對不同算法的比較,XGBoost算法表現(xiàn)最佳,具有更高的預測準確性和泛化能力。此外,研究還利用深度學習方法實現(xiàn)了水稻倒伏的自動識別,準確率達到94.87%,為無人機高通量表型分析和智能化水稻育種提供了技術(shù)支撐。整體而言,該研究為大規(guī)模高產(chǎn)水稻品種篩選與精準農(nóng)業(yè)生產(chǎn)提供了一種高效、低成本、非破壞性的遙感監(jiān)測方法,并建議未來結(jié)合多傳感器與更多紋理及形態(tài)特征,進一步提升模型的適用性和智能化水平。
地址:無錫市梁溪區(qū)南湖大道飛宏路58-1-108
電話:13810664973
地址:北京市海淀區(qū)中關(guān)村大街19號
電話:13810664973
地址:陜西省西安市高新區(qū)科技一路40號盛方科技園B座三層東區(qū)
電話:13810664973
地址:成都市青羊區(qū)順城大街206號四川國際大廈七樓G座
電話:13810664973