高光譜成像結合機器學習模型用于不同原發灶頭頸部轉移瘤的鑒別診斷

來源：江蘇雙利合譜科技有限公司 2026年06月24日 09:27

應用方向：高光譜成像技術（HSI）通過在像素級同時獲取空間信息與連續光譜信息，能夠反映組織在細胞和分子層面的生物學差異，為復雜疾病的精準識別提供了新的技術路徑。基于該文獻的研究結果，HSI 在醫學領域，尤其是在腫瘤診斷與分型方面展現出廣闊的應用前景。通過捕獲組織在光譜層面的差異特征，實現對形態學上高度相似病變的有效區分，從而彌補傳統影像學和病理診斷在信息維度上的不足。此外，結合機器學習與集成學習方法，HSI 能夠支持構建高精度、低誤診率的智能診斷模型，提升復雜臨床場景下的診斷效率與一致性。總體而言，高光譜成像技術與智能算法的深度融合，有望推動醫學影像診斷由經驗依賴型向數據驅動型轉變，為精準醫學和智能醫療提供重要技術支撐。

背景： 頭頸部轉移性腫瘤（MTHN）通常提示腫瘤已處于進展期或晚期，其原發灶來源復雜，不同原發腫瘤在治療方案和預后評估上存在顯著差異。因此，快速、準確地判定頭頸部轉移腫瘤的原發部位對于制定精準治療策略具有重要臨床意義。然而，當前 MTHN 的診斷主要依賴影像學檢查和病理學分析，前者對微小病灶敏感性有限、易發生誤診，后者雖為金標準，但存在取樣誤差、主觀性強且診斷周期較長等問題，難以滿足臨床對高效、客觀診斷的需求。近年來，機器學習與深度學習方法在醫學影像分析中展現出良好潛力，但現有研究多集中于單一腫瘤類型，且受限于傳統成像手段信息維度不足，*型對不同原發來源腫瘤的判別能力和泛化性仍有待提升。高光譜成像（HSI）能夠在像素級上獲取空間信息與連續光譜信息，反映組織在細胞和分子層面的生物學差異，為腫瘤類型區分提供了更豐富的信息基礎。因此，將高光譜成像與機器學習方法相結合，構建高性能、魯棒性的分類模型，用于頭頸部轉移性腫瘤不同原發部位的快速識別，成為當前亟需解決的重要研究問題之一。

作者信息：李瑋，山東大學控制科學與工程學院，碩導

期刊來源：Journal of Biophotonics

研究內容

通過采用 Stacking 方法對多個結構相對簡單的機器學習模型進行集成，有效增強了模型對光譜特征波段中蘊含的生物學信息的挖掘能力，從而提升了模型學習過程的穩定性和分類判別的可靠性。本研究為 MTHN 類型的臨床快速診斷及相應治療措施的制定提供了一種可行且有效的技術解決方案。

實驗設計

本研究收集了山東第一醫科大學附屬腫瘤醫院存檔的208張蘇木精-伊紅（HE）染色病理切片，于20倍放大倍數下進行圖像采集。所用頭頸部轉移性腫瘤（MTHN）樣本來源于六種常見原發惡性腫瘤：肺腺癌（LAC）、鼻咽癌（NPC）、乳腺癌（BC）、食管鱗狀細胞癌（ESCC）、胃腸道腺癌（GIAC）及甲狀腺乳頭狀癌（PTC）。樣本依據原發灶來源進行分型標記：0型代表NPC，1型代表LAC，2型代表PTC，3型代表BC，4型代表ESCC，5型代表GIAC。

采用線掃描推掃式高光譜成像系統（GaiaMicro-V10E-DY，江蘇雙利合譜科技有限公司）在熒光模式下采集MTHN樣本的高光譜圖像。該系統由覆蓋400–1000 nm光譜范圍（256個波段）的光譜儀、空間分辨率為1392×1550像素的高性能sCMOS相機、顯微鏡及一體化移動平臺組成。HSI系統的圖像采集與分析原理如圖1所示。

圖1 高光譜成像系統結構示意圖

研究方法

不同原發灶來源的頭頸部轉移性腫瘤（MTHN）蘊含獨特的生物標志物信息，可被HSI系統捕獲并以光譜數據形式呈現，供進一步分析。基于此，本研究采用主成分分析（PCA）和盲源分離-主成分分析（BSS-PCA）方法進行光譜波段篩選。在Stacking集成學習框架下，選用支持向量機（SVM）和輕量級梯度提升機（LightGBM）作為基學習器，隨機森林（RF）作為元學習器，構建了高性能分類模型MTHN-SC（頭頸部轉移性腫瘤堆疊分類器）。隨后，應用SVM、LightGBM、MTHN-SC、ResNet50和FastGRNN模型對篩選后的光譜波段數據進行分類，建立了兼具高精度與強魯棒性的MTHN診斷流程（圖2）。

圖2 研究方法流程圖

對于SVM，通過引入核函數， SVM能夠高效處理復雜的非線性分類任務，本研究在 SVM 模型中采用徑向基函數（RBF）核。通過網格搜索方法對 RBF 核的相關參數進行了優化選擇。此外，本研究中的 LightGBM 模型采用基于梯度的貝葉斯優化方法，自動確定*優的決策樹節點數量，并使用基于梯度提升決策樹（GBDT）的提升策略進行模型構建。ResNet50和FastGRNN模型添加了dropout和L2正則化策略。

對于MTHN-SC，本研究在 Stacking 框架的第一層采用了基于RBF核的SVM和基于GBDT的 LightGBM 作為基模型，在第二層選用了隨機森林作為元模型。Stacking 集成模型的整體結構如示意圖所示。圖 3 展示了 MTHN-SC 模型的詳細結構，體現了基模型（SVM 和 LightGBM）與元模型（隨機森林）之間的集成關系。

圖3 MTHN-SC模型結構示意圖

結果

本研究對MTHN樣本病理切片的HSI光譜曲線進行了反射率校準。圖4直觀展示了病理切片HSI數據經校準處理前后的對比效果。反射率校準通過將原始數字圖像數據轉換為反射率值，顯著提高了對病理組織細微光譜變化的檢測敏感性，使各類組織間的光譜差異在校準后的數據中更為凸顯。

圖4 HSI反射率校準流程。(a) HSI相機采集的LAC病理切片圖像；(b) 感興趣區域（圖a中綠色框選區域）的原始光譜曲線；(c) 經反射率校準后的光譜曲線。

圖5比較了不同原發灶來源MTHN的平均光譜反射率曲線，不同原發灶MTHN的光譜反射率強度存在顯著差異，這些差異源于不同原發癌特定生物組分的內在光譜特性，為利用機器學習鑒別腫瘤原發灶提供了堅實的理論依據。

圖5 不同原發灶MTHN平均光譜曲線對比

本研究對反射率校準后的高光譜圖像進行圖像增強與分割策略，有效擴充了樣本量。應用PCA和BSS-PCA兩種不同的特征提取方法來處理樣品的全光譜（256個波段）數據。經特征選擇后，選用徑向基核函數支持向量機（SVM-RBF）、LightGBM、基于Stacking技術的融合模型（MTHN-SC）及ResNet50四種機器學習模型，系統評估其對六種不同原發灶來源MTHN的鑒別性能。評價指標涵蓋準確率（Accuracy）、召回率（Recall）和特異度（Specificity）三項核心指標。下表匯總了各模型在PCA與BSS-PCA兩種特征選擇方法下的性能表現，實驗結果表明，傳統 PCA 特征選擇下各模型性能差異明顯，且在高維判別信息保留方面存在一定局限。相比之下，BSS-PCA 能夠更有效地提取判別特征，顯著提升整體分類性能，其中 BSS-PCA 與 MTHN-SC 的組合取得了最高準確率（82.47%），并在召回率和特異性上均表現*優。得益于 Stacking 結構對多模型信息的有效融合，MTHN-SC 在降低誤分類和過擬合風險的同時顯著增強了泛化能力。盡管 ResNet50 展示了深度學習在高光譜數據分析中的潛力，但其性能和實用性仍受限于數據規模和計算成本。

結論

本研究利用 HSI 技術對來源于六種不同原發部位的 MTHN 病理切片進行采集與分析，采用 PCA 和 BSS-PCA 兩種特征波段選擇方法，并結合四種機器學習模型（SVM-RBF、LightGBM、MTHN-SC 和 ResNet50）對腫瘤類型進行分類，旨在通過多模型協同提升 MTHN 的分類精度。MTHN-SC 模型通過 Stacking 結構集成 SVM、LightGBM 和隨機森林，充分發揮不同算法的互補優勢，將線性模型與樹模型的預測能力有效融合，從而提升診斷準確率。該模型采用 BSS-PCA 進行特征波段選擇，相較于傳統 PCA，能夠增強特征判別能力并有效抑制噪聲，為機器學習模型提供更高質量的輸入數據，這在處理高維高光譜數據時具有顯著優勢。通過引入隨機森林作為元模型對 SVM 和 LightGBM 的輸出進行融合，MTHN-SC 有效降低了醫學機器學習中常見的偏置和過擬合風險，顯著提升了診斷過程的魯棒性和泛化能力。實驗結果表明，MTHN-SC 模型取得了 82.47% 的診斷準確率，在對比模型中表現*優，驗證了其在多原發部位 MTHN 快速、準確診斷中的應用潛力，對精準治療方案制定及高光譜技術在醫學診斷中的推廣具有重要意義。

相關產品

免責聲明

凡本網注明“來源：化工儀器網”的所有作品，均為浙江興旺寶明通網絡有限公司-化工儀器網合法擁有版權或有權使用的作品，未經本網授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的，應在授權范圍內使用，并注明“來源：化工儀器網”。違反上述聲明者，本網將追究其相關法律責任。
本網轉載并注明自其他來源（非化工儀器網）的作品，目的在于傳遞更多信息，并不代表本網贊同其觀點和對其真實性負責，不承擔此類作品侵權行為的直接責任及連帶責任。其他媒體、網站或個人從本網轉載時，必須保留本網注明的作品第一來源，并自負版權等法律責任。
如涉及作品內容、版權等問題，請在作品發表之日起一周內與本網聯系，否則視為放棄相關權利。

高光譜成像結合機器學習模型用于不同原發灶頭頸部轉移瘤的鑒別診斷

免責聲明

聯系我們

關注我們