三源數據強強融合!高光譜聯動株高、葉氮指標助力煙田數字化估產體系
應用方向
在我國煙草生產必須嚴格執行上級下達的計劃產量的背景下,準確且穩定的產量估算對生產管理具有重要意義。本文提出多源數據融合策略,構建煙草產量估算模型:數據包括無人機(UAV)機載高光譜特征(HF)、田間采集的生物物理參數(BPP)以及實驗室測定的生化參數(BCP)。考慮不同生育期的作物狀態共同影響最終產量,模型采用兩類典型循環神經網絡(RNN)——LSTM與GRU,并以隨機森林(RF)作為基線。針對跨年度數據時間維度不一致問題,設計一維卷積自編碼器(AEC1D)以統一輸入維度。結果表明,多源融合優于任一單源特征;其中采用HF+BCP+BPP的GRU模型精度最高(
=0.705)。同時,LSTM與GRU整體優于RF;特征貢獻約為HF45%、BPP32%、BCP23%。該研究驗證了多源融合與 RNN 在煙草產量估算中的優勢,可為精準化田間管理提供支持。
關鍵詞:多源數據融合;RNN;產量估算;HF+BCP+BPP;AEC1D
背景
我國煙草屬于重要經濟作物,為調控市場供給、保持產品與價格穩定,行業主管部門對企業下達年度生產計劃,產量超出計劃通常需要額外審批,因此企業急需“準確、穩定”的產量估算以支撐生產決策與過程管理。傳統產量估算主要依賴田間調查,存在耗時、成本高且誤差大的問題。近年來,以高光譜成像為代表的無損監測技術在農業中得到廣泛應用,但高光譜數據波段多、信息冗余強,若僅構建植被指數易受土壤背景與冠層結構影響且可能出現飽和,光譜信息利用率也有限。另一方面,產量與 LAI、株高、葉氮等生物物理/生化指標密切相關,但將“高光譜特征(HF)+生物物理參數(BPP)+生化參數(BCP)”三類信息聯合用于煙草產量建模的研究仍相對不足。基于此,本文提出多源融合并引入能學習時序依賴的 RNN(LSTM/GRU),同時設計 AEC1D處理跨年觀測次數不一致,以構建更全面、可用于生產管理的煙草產量估算框架。
實驗與數據采集
(1)實驗設置
本研究在云南省大理州彌渡縣(MD)與祥云縣(XY)開展兩年田間試驗,覆蓋多地塊與多品種情景。試驗以氮肥梯度為主開展處理設計,其中 N100 為當地常規施肥量,N0 為不施氮,N150 為 1.5 倍常規量,其余處理按比例推算;整體采用隨機區組設計,每小區不少于 80 株,株行距為 1.2 m×0.5 m,其余田間管理措施按照當地規范執行。觀測安排選擇關鍵生育期開展:2022 年在蓮座期、現蕾期與打頂期共觀測 3 次,而 2023 年受天氣條件限制僅在蓮座期與打頂期觀測 2 次,導致跨年度樣本的時間步(time step)不一致。

圖1研究區域的地理位置及實驗樣地的布置
(2)數據采集
本研究構建了“無人機高光譜-田間生物物理-實驗室生化指標-實測產量”的多源數據體系。無人機端采用DJI M600搭載江蘇雙利合譜科技有限公司的GaiaSky-mini2-VN高光譜相機獲取400~1000 nm(175波段)的冠層光譜數據,飛行通常安排在10:00~15:00的晴朗無風時段,航高約80 m,起飛前使用灰板進行輻射定標,影像在ENVI平臺完成后續處理。田間同步采集生物物理參數(BPP),包括株高(PH)、株幅(PW)與葉面積指數(LAI);生化參數(BCP)則包括葉氮含量(LNC)與葉綠素相對含量(LCC,SPAD)。其中LNC以小區中心隨機抽取2株植株、每株取上中部各2片葉送實驗室測定;LCC 使用SPAD-502Plus在同一批測量株上選擇完*展開葉多點測量并取平均得到小區代表值。產量標簽以烘烤后煙葉重量為準:收獲前每小區選取5株代表植株標記,煙葉烘烤約1周后稱重(剔除未完*轉黃葉片),并以5株烘烤葉總重Yinit按Yield = 3.33×Yinit換算為單位面積產量(t/ha)。數據集最初為231個樣本,剔除病害與影像質量不佳小區后保留189個有效樣本;每個生育期樣本包含PH、PW、LAI、LNC、LCC以及175個高光譜波段等特征。
研究結果
(1)多源特征體系構建與對比
研究在高光譜基礎上分別疊加BCP(LNC、LCC)與BPP(PH、PW、LAI)進行對比,結果在RF、LSTM、GRU三類算法下均一致:多源融合顯著優于單一HF,且HF+BCP+BPP始終取得最高或*穩定的精度;同時HF+BPP通常略優于HF+BCP,說明結構/群體生長狀態信息對葉產量更直接。僅用HF時精度*低,體現“光譜必要但不充分”,需要生物物理/生化信息補足對生長與營養狀態的刻畫。

(a)不同特征組合下RF的產量估算

(b)不同特征組合下LSTM的產量估算

(c)不同特征組合下GRU的產量估算
圖2基于多種模型構建的產品估計模型散點圖對比
(2)煙草高光譜特征重構與降維
從提升煙草估產可用光譜信息與可學習性的角度,本研究引入SFI將整條光譜曲線按一階導數的5個穩定極值分段,對各段進行擬合并求定積分,把全譜壓縮為5維特征。該重構顯著降低維度與冗余,并保留了光譜曲線形態與全譜響應信息,相比僅依賴少數植被指數更充分利用高光譜數據,并增強對外界因素與參數擾動的魯棒性,為后續多源融合與RNN時序學習提供更穩定、緊湊的光譜輸入。
(3)跨年觀測時序維度統一
本研究針對跨年度樣本的聯合時序建模對2022年三期觀測與2023年兩期觀測導致的輸入時間維不一致問題,引入一維卷積自編碼器(AEC1D)作為時序對齊模塊。該模型在編碼端利用1×2卷積核(stride=1)在相鄰生育期之間提取局部時序關聯,并將2022年的3個時間步壓縮映射為2個時間步;隨后經解碼重構得到與2023一致的輸入形狀,從而在統一維度的同時盡量保留生育期動態信息。重構結果顯示,不同特征組合下測試集R2仍保持較高且與訓練集差異較小,表明該方法具有較好的泛化能力,并優于簡單padding補零對齊,為后續LSTM/GRU產量估算提供穩定一致的時序輸入。
圖3設計的AEC1D編碼器組件

圖4不同特征組合下的重建結果對比
結論
本文面向煙草生產計劃管理對“準確、穩定”產量估算的需求,構建了融合無人機高光譜特征(HF)、田間生物物理參數(BPP)與生化參數(BCP)的多源估產框架,并引入循環神經網絡(LSTM/GRU)刻畫多生育期時序信息。結果表明,多源融合顯著優于任一單源輸入,*優組合為HF+BCP+BPP;在該組合下GRU取得最高精度(
=0.705,RMSEV=0.554 t/ha,MAPEV=16.41%),LSTM次之且整體優于RF等傳統方法。同時,針對跨年度觀測次數不一致(2022三期、2023兩期)導致RNN輸入形狀不統一的問題,提出一維卷積自編碼器AEC1D進行時序維度對齊,相比padding補零對齊獲得更優的建模表現。結果分析顯示三類特征對精度提升的平均貢獻約為HF 45%、BPP32%、BCP23%。本研究驗證了“多源融合+RNN”的煙草估產優勢,并指出未來可進一步融合氣候、土壤、水分等影響因素以完*模型適用性。
來源
Zhang M ,Zhang B ,Zhao C , et al.Tobacco yield estimation via multi-source data fusion and recurrent neural networks[J].International Journal of Applied Earth Observation and Geoinformation,2025,144104925-104925.
相關產品
免責聲明
- 凡本網注明“來源:化工儀器網”的所有作品,均為浙江興旺寶明通網絡有限公司-化工儀器網合法擁有版權或有權使用的作品,未經本網授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:化工儀器網”。違反上述聲明者,本網將追究其相關法律責任。
- 本網轉載并注明自其他來源(非化工儀器網)的作品,目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責,不承擔此類作品侵權行為的直接責任及連帶責任。其他媒體、網站或個人從本網轉載時,必須保留本網注明的作品第一來源,并自負版權等法律責任。
- 如涉及作品內容、版權等問題,請在作品發表之日起一周內與本網聯系,否則視為放棄相關權利。
手機版
化工儀器網手機版
化工儀器網小程序
官方微信
公眾號:chem17
掃碼關注視頻號
















采購中心