背景
水分含量(Moisture content, MC)和脂肪酸含量(Fatty acid content, FAC)是大米品質(zhì)的重要指標(biāo),影響大米的存儲(chǔ)和食用品質(zhì)。因此,建立一種快速、準(zhǔn)確、無損的MC和FAC檢測(cè)方法至關(guān)重要。
可見/近紅外光譜可以響應(yīng)樣品中的某些含氫基團(tuán),從而獲得樣品中的內(nèi)部化學(xué)信息。該技術(shù)已被用于檢測(cè)農(nóng)產(chǎn)品中的水分和脂肪酸含量。同時(shí),與可見光/近紅外光譜相比,高光譜成像(Hyperspectral imaging, HSI)技術(shù)具有光譜與圖像相結(jié)合的優(yōu)勢(shì)。利用每個(gè)像素點(diǎn)的光譜預(yù)測(cè)水稻的MC和FAC,形成水稻的MC和FAC的可視化分布,使檢測(cè)結(jié)果更加直觀。但是,HSI技術(shù)也存在數(shù)據(jù)量大、實(shí)時(shí)性差等缺點(diǎn),難以在實(shí)際中應(yīng)用。然而,這些問題可以通過數(shù)據(jù)降維和特征波長選擇來解決。
本研究的目的是結(jié)合HSI技術(shù)與化學(xué)計(jì)量學(xué)方法,建立一種快速簡便的水稻MC和FAC檢測(cè)方法。(1)采用不同的預(yù)處理方法對(duì)大米和精米的光譜進(jìn)行預(yù)處理,建立了MC和FAC的全波段預(yù)測(cè)模型。最后根據(jù)模型性能確定*佳預(yù)處理方法。(2)采用兩種變量選擇方法篩選大米和精米在900~1700 nm區(qū)域的MC和FAC的顯著波長。(3)比較了MC和FAC模型在大米和精米中的性能,并分析了稻殼對(duì)MC和FAC模型性能的影響。(4)利用*佳模型預(yù)測(cè)每個(gè)像素點(diǎn)的MC和FAC,實(shí)現(xiàn)水稻樣品MC和FAC的可視化。
試驗(yàn)設(shè)計(jì)
浙江農(nóng)林大學(xué)孫通副教授團(tuán)隊(duì)利用GaiaField-N17E高光譜成像系統(tǒng)(江蘇雙利合譜)獲取了13個(gè)水稻品種的大米和精米高光譜影像(圖1)。近紅外高光譜成像儀的光譜范圍為900~1700 nm,空間分辨率為640像素,波段數(shù)為512,光譜分辨率為5 nm。對(duì)獲得的高光譜影像利用OTSU方法獲取其前景像素,并計(jì)算大米和精米平均光譜。
預(yù)處理可以去除高頻隨機(jī)噪聲和基線漂移等噪聲,提高模型性能。本研究采用了5種預(yù)處理方法,包括多元散射校正(MSC)、標(biāo)準(zhǔn)正態(tài)變量變換(SNV)、Savitzky-Golay(SG)平滑、SG+一階導(dǎo)數(shù)和SG導(dǎo)數(shù)。根據(jù)全波段模型的性能,選擇最合適的預(yù)處理方法。為提高計(jì)算速度,減少數(shù)據(jù)冗余,本研究采用競(jìng)爭自適應(yīng)重加權(quán)采樣(CARS)和連續(xù)投影算法(SPA)選擇大米/精米中MC和FAC的顯著波長。
圖1高光譜成像系統(tǒng)
結(jié)論
大米和精米在900~1700 nm波長范圍內(nèi)的原始反射光譜如圖2所示。從圖2可以看出,大米和精米的光譜在900~1400 nm波長范圍內(nèi)具有相同的趨勢(shì)。然而,大米的反射光譜逐漸增加,而精米的反射光譜在1400~1700 nm波長范圍內(nèi)趨于穩(wěn)定。此外,大米光譜的反射率值普遍高于精米。這可能是由于大米和精米的顏色、光滑度和透明度不同造成的。在960、1200和1450 nm處有三個(gè)明顯的峰。960 nm左右的峰值可能是由水和碳水化合物中O-H二階泛音的協(xié)同作用引起的。1200 nm左右的峰值與樣品的MC有關(guān),1450 nm左右的峰值歸因于O-H拉伸第一泛音。
圖2 大米(a)和精米(b)樣品的原始光譜
采用5種預(yù)處理方法對(duì)大米和精米樣品的光譜進(jìn)行處理,利用PLSR算法建立MC和FAC的估測(cè)模型。由表1可知,在“大米-水分”模型中,SNV和SG-2預(yù)處理效果更好。采用SNV預(yù)處理建立的模型R2較高,達(dá)到0.9682。但該模型不穩(wěn)定,魯棒性較差。因此,SG-2模型的性能優(yōu)于SNV模型。在“大米-脂肪酸”模型中,SG-2是*佳的預(yù)處理方法。對(duì)于“精米-水分”模型,SG-2預(yù)處理的R2較高。綜上所述,在“大米-水分”、“精米-水分”和“大米-脂肪酸”3種預(yù)測(cè)模型中,SG-2是*佳的預(yù)處理方法。而在“精米-脂肪酸”模型中,SG平滑是*好的預(yù)處理方法,模型的R2p和RMSEP分別為0.8427和1.7806。
從表1可以看出,大米中MC的模型性能優(yōu)于精米。這是因?yàn)榈練ず兴?,其吸水能力高于精米。因此,?dāng)大米樣品經(jīng)過水處理后,稻殼比精米吸收更多的水分。因此,大米光譜中含有的水分信息比精米光譜中含有的水分信息更多。相比之下,精米中FAC的模型性能優(yōu)于大米。稻殼主要由纖維素、半纖維素、木質(zhì)素等成分組成,其中不含脂肪酸。稻殼中存在的干擾信息會(huì)影響建模過程中脂肪酸的預(yù)測(cè)。因此,得到的光譜信息可能會(huì)受到谷殼的干擾,導(dǎo)致精米的預(yù)測(cè)精度降低。
表1 不同預(yù)處理方法下樣品中水分和脂肪酸的PLS模型預(yù)測(cè)結(jié)果
由于采用SG或SG-2預(yù)處理的MC和FAC模型效果*好,因此對(duì)這些光譜進(jìn)行了CARS和SPA特征優(yōu)選。由表2可以看出,相較于CARS,SPA選擇更少的重要波長,使實(shí)際應(yīng)用更容易,同時(shí)SPA模型的RPD值較高,模型精度較高。此外,SPA模型的性能優(yōu)于全波段模型,這表明SPA選擇的波長幾乎包含了MC或FAC的所有有效信息。與全波段模型的結(jié)果相似,SPA模型對(duì)大米中MC的預(yù)測(cè)精度高于精米,而對(duì)大米中FAC的預(yù)測(cè)精度低于精米。“大米-水分”、“精米-水分”、“大米-脂肪酸”的*佳模型為“SG2-SPA-PLS”,“精米-脂肪酸”的*佳模型為“SG-SPA-PLS”。
SPA選擇的波長如表3所示。MC模型選擇的964.17、965.74、975.16、978.29、1373.75和1395.72 nm波長與水分波長相似,歸功于O-H拉伸的第一、第二和第三泛音。對(duì)于FAC模型,選擇的1095.99、1387.87和1516.56 nm波長歸功于C-H的一、二泛音和-CH2基團(tuán)的拉伸,選取的939.06、964.17和967.31 nm波長主要來自于O-H鍵的彎曲振動(dòng)。
表2 使用選定波長的樣品中水分和脂肪酸的PLS模型預(yù)測(cè)結(jié)果
表3 由SPA選擇的波長
通過Fearn(1996)提出的方法驗(yàn)證稻殼對(duì)MC和FAC預(yù)測(cè)精度的影響。在95%置信水平下計(jì)算區(qū)間是否包含0。如果它包含0,則偏差在5%的水平上沒有顯著差異。由表4可知,大米和精米中MC的預(yù)測(cè)誤差計(jì)算區(qū)間均為0,而FAC的不為0。這表明大米與精米中FAC的預(yù)測(cè)誤差存在顯著差異,因此稻殼對(duì)FAC的預(yù)測(cè)精度有一定的影響。
表4 大米和精米的水分和脂肪酸含量在95%置信水平上存在顯著差異
圖3為不同水分梯度下水稻樣品MC的可視化結(jié)果。可以看出,水稻樣本的MC越高,可視化圖像中的紅色區(qū)域越大,而水稻樣本的MC越低,可視化圖像中的藍(lán)色區(qū)域越大。這與大米樣本的實(shí)際MC一致,說明MC模型對(duì)每個(gè)像素的MC預(yù)測(cè)是準(zhǔn)確的。此外,可視化圖像中大米樣品的MC分布不均勻,這可能是由于樣品處理過程中吸濕不均勻造成的。圖4為大米樣品FAC可視化結(jié)果。FAC模型可以準(zhǔn)確預(yù)測(cè)每個(gè)像素的FAC??梢暬梢灾庇^地反映水稻中MC和FAC的空間變化,可以在像元水平上了解MC和FAC的分布情況。因此,在儲(chǔ)存前檢驗(yàn)和儲(chǔ)存監(jiān)測(cè)中,可以在很小的范圍內(nèi)檢測(cè)到異常的MC和FAC,從而保證了大米的質(zhì)量安全。
圖3 大米含水量可視化圖
圖4 大米脂肪酸含量可視化圖
作者信息
孫通,博士,浙江農(nóng)林大學(xué)光機(jī)電工程學(xué)院副教授,碩士生導(dǎo)師。
主要研究方向:農(nóng)林產(chǎn)品光譜智能檢測(cè)技術(shù)研究及裝備開發(fā)。
參考文獻(xiàn):
Song, Y., Cao, S., Chu, X., Zhou, Y., Xu, Y., Sun, T., Zhou, G., & Liu, X. (2023). Non-Destructive Detection of Moisture and Fatty Acid Content in Rice using Hyperspectral Imaging and Chemometrics. Journal of Food Composition and Analysis, 11.
https://doi.org/10.1016/j.jfca.2023.105397
地址:無錫市梁溪區(qū)南湖大道飛宏路58-1-108
電話:13810664973
郵箱:info@dualix.com.cn
地址:北京市海淀區(qū)中關(guān)村大街19號(hào)
電話:13810664973
郵箱:info@dualix.com.cn
地址:陜西省西安市高新區(qū)科技一路40號(hào)盛方科技園B座三層?xùn)|區(qū)
電話:13810664973
郵箱:info@dualix.com.cn
地址:成都市青羊區(qū)順城大街206號(hào)四川國際大廈七樓G座
電話:13810664973
郵箱:info@dualix.com.cn