背景
高光譜遙感可獲得窄波段的連續光譜信息,可提供大量關于作物理化參數的豐富信息。但是使用全波段作為輸入變量會帶來較大的噪聲和冗余信息,同時必然會增加數據處理負荷、儀器成本和應用的復雜性。因此現有研究中通常選擇一小組傳達數據主要信息的敏感特征來反演作物目標參數。
目前,協同區間偏最小二乘(SIPLS)或連續投影算法(SPA)已被成功應用于優特征的選擇。SIPLS可以保證所選波長的連續性,使模型性能穩定。然而,研究中發現SIPLS選擇的區間位置和長度都是固定的,這表明優選特征中存在無用信息和共線性。而SPA是建立在凸幾何端元搜索算法上的。因此,該方法可以降低對離群像素的敏感性,并生成真實的端元。同時,SPA的目標是在所有數據中選擇共線性最小的變量,這比其他算法提供的結果更具可重復性,但其所選擇的變量也可能存在信噪比低或共線性較小的現象。
為了克服這些缺點并促進高光譜數據的特征選擇,本研究提出了一種新的混合的特征選擇方法,命名為SIPLS-SPA,并將選取的優光譜特征用于建立更準確、穩定的小麥葉片生物量監測模型。
試驗設計
南京農業大學姚霞教授團隊利用江蘇雙利合譜公司的可見/近紅外高光譜成像系統Gaiafield-V10E,獲取了小麥不同生育期的冠層高光譜影像,并對影像進行預處理從而獲得平均光譜(圖1)。
圖1 小麥冠層高光譜影像預處理流程
利用SIPLS-SPA進行特征優選的主要步驟:(1)全波段(400-1000 nm)被分成P個區間(25-50);(2)結合Q(Q = 2,3,4)與相應葉片生物量建立PLSR模型;(3)重復步驟(1)和(2),選擇使PLSR模型的RMSE最小時的P和Q的值;(4)根據確定的P和Q,得到敏感特征的光譜矩陣,設為X(N*J,N為樣本數,J為光譜變量數);(5)隨機選取一列為Xj,其余定義為S;(6)分別計算Xj對S的投影。S的最大投影表示最小相關性,其對應的列定義為Xi;(7)設置Xi而不是Xj,并重復步驟(5)和(6),直到所選變量的數量達到預設值M。M的值是通過多次數據計算確定的。在本研究中,M = 20;(8)將選擇的變量與相應生物量擬合多元線性回歸(MLR)模型。最后,選擇使MLR的RMSE最小的變量。
結論
通過步驟(1)-(4),成功獲得了每個PLSR模型的RMSEcv。結果表明,在P = 37和Q = 4條件下獲得了RMSEcv z低的最佳PLSR模型(圖2)。這意味著當整個光譜區域平均劃分為37個區間時,用4個區間(22、24、30和37)構建的PLSR模型表現最好。運行步驟(5)-(8),確定最佳高光譜變量為706、724、734、806、808、810、812和816 nm。
圖2 不同P和Q值下SIPLS模型的RMSEcv
利用SIPLS-SPA選擇的輸入變量,建立了小麥葉片生物量在五個生長階段的校準模型(圖3)。
圖3 SIPLS-SPA在校準(A)和驗證(B)中估算的小麥葉片生物量的實測值與預測值之間的1:1擬合關系
通過對比SIPLS、SPA和SIPLS-SPA選擇的敏感特征(表1)。結果表明,SIPLS對小麥葉片生物量的敏感特征分別為694-706、722-734、806-816和890-900 nm,而SPA的敏感特征分別為726、744、758、816和830 nm。簡而言之,SIPLS選擇的敏感特征比SPA和SIPLS-SPA多。以SPA、SIPLS和SPA-SIPLS選擇的敏感特征為輸入變量,構建小麥葉片生物量PLSR模型。結果表明,SIPLS模型和全波段模型的Rc2最大(0.84),其次是SPA模型和SIPLS-SPA模型。而采用SIPLS-SPA模型得到的Rv2最大(Rv2 = 0.67),采用SIPLS模型得到的Rv2最小。利用SIPLS-SPA選擇的敏感特征建立的模型RMSEv最小(0.059 kg/m2),RRMSEv最小(38.55%)。
使用三個指標對PLSR模型的實用性進行評價(表2)。結果表明,SPA模型運行時間最短,其次是SIPLS-SPA模型,而全波段模型運行時間最長。SPA模型和SIPLS-SPA模型的矩陣復雜度和計算復雜度相似且較低,但全波段模型的矩陣復雜度和計算復雜度最高。
表1 SIPLS、SPA和SIPLS-SPA選擇的敏感特征
表2 利用SIPLS、SPA和SIPLS-SPA方法提取敏感變量建立PLSR模型的實用性
作者信息
姚霞,博士,南京農業大學國家信息農業工程技術中心教授,博士生導師。
主要研究方向:基于高光譜/日光誘導葉綠素熒光/激光雷達的星-機-地作物生長監測;作物表型高通量獲取等。
參考文獻:
Jia, M., Li, W., Wang, K., Zhou, C., Cheng, T., Tian, Y., Zhu, Y., Cao, W., & Yao, X. (2019). A newly developed method to extract the optimal hyperspectral feature for monitoring leaf biomass in wheat. Computers and Electronics in Agriculture, 165.
立即詢價
您提交后,專屬客服將第一時間為您服務