如何分析光譜信息?光譜信息解析方法
發(fā)布時間:2024-06-19
瀏覽次數(shù):342
在光譜信息解析過程中, 因光譜系統(tǒng)采集的光譜信息會受到采集環(huán)境、 光學條件和儀器性能等因素的影響, 故原始光譜信息除含有被測樣品屬性的信息外, 還包含大量無關信息, 如噪聲、 背景干擾、 雜散光等。
?
光譜信息解析流程
在光譜信息解析過程中, 因光譜系統(tǒng)采集的光譜信息會受到采集環(huán)境、 光學條件和儀器性能等因素的影響, 故原始光譜信息除含有被測樣品屬性的信息外, 還包含大量無關信息, 如噪聲、 背景干擾、 雜散光等。 為消除光譜冗余信息, 提高模型的預測精度, 對光譜信息進行預處理并提取有效信息是模型建立前的重要環(huán)節(jié)。 一般的光譜信息解析步驟主要包括光譜信息的采集、 光譜信息的預處理、 變量的篩選、 預測模型的建立、 模型的評價等, 其流程圖如圖3所示。
?
?
光譜信息預處理
光譜信息解析首要環(huán)節(jié)就是對采集的光譜信息進行預處理, 常用光譜信息預處理方法[12]主要有平滑(smoothing), 包括移動平均法(moving average, MA)和卷積法(savitzky-golay, SG)等、 導數(shù)修正(derivative correction), 包括一階導數(shù)(first-order derivative, 1stD)和二階導數(shù)(second-order derivative, 2ndD)、 歸一化(normalization, NOR)、 標準正態(tài)變換(standard normal variable transformation, SNV)、 多元散射校正(multiplicative scattering correction, MSC)、 小波變換(wavelet transform, WT)等, 其作用效果如表2所示。
?
?
光譜信息變量篩選
光譜信息中存在的大量冗余信息會降低預測模型的準確性和穩(wěn)定性。 為提高模型運算速度和精度, 進行光譜信息變量篩選是十分必要的。 常用變量篩選方法[13]主要有變量區(qū)間選擇算法, 包括移動窗口偏最小二乘法(moving windows partial least squares, MWPLS)和區(qū)間偏最小二乘法(interval partial least squares, iPLS)等、 無信息變量消除算法(uninformative variable elimination, UVE)、 遺傳算法(genetic algorithm, GA)、 連續(xù)投影算法(successive projections algorithm, SPA)和競爭性自適應重加權算法(competitive adaptive reweighted sampling, CARS)等, 其特點如表3所示。
?
?
光譜信息模型建立
建立樣品待測指標的數(shù)學模型是光譜信息解析過程中關鍵的一步, 不同的建模方法會直接影響模型的準確性和穩(wěn)定性。 常用的建模方法[14]主要有多元線性回歸(multi linear regression, MLR)、 主成分回歸(principal component regression, PCR)、 偏最小二乘回歸(partial least squares regression, PLSR)、 支持向量機(support vector machine, SVM)、 最小二乘支持向量機(least square support vector machine, LS-SVM)等, 其特點如表4所示。
?
?
光譜信息模型評價
在樣品待測指標的預測模型建立后, 需對模型進行評價, 常見的模型預測性能評價標準[15]主要有預測集相關系數(shù)(correlation coefficient of prediction set, RP)、 校正集相關系數(shù)(correlation coefficient of calibration set, RC)、 決定系數(shù)(coefficient of determination, R2)、 預測標準偏差(root mean square error of prediction, RMSEP)、 校正標準偏差(root mean square error of calibration, RMSEC)、 剩余預測偏差(residual predictive deviation, RPD)等。 質(zhì)量較高的模型具有較高的RP, RC, R2和RPD, 較低且較為接近的RMSEP和RMSEC。
通過對常用光譜信息解析方法的總結可以看出, 機器學習算法已逐漸應用于光譜信息的變量篩選和模型建立, 雖然提高了模型精度, 但是模型的普適性和實用性仍不能滿足實際需要。 現(xiàn)階段, 深度學習作為機器學習的分支迅速崛起, 深度網(wǎng)絡的規(guī)模和精度也在不斷提高, 并且持續(xù)成功地應用于各類實際問題。 為進一步提高模型的精度和泛化能力, 使其能夠滿足現(xiàn)代生產(chǎn)的需要, 應用深度學習算法進行光譜信息解析將是今后發(fā)展的必然趨勢之一。
?
原文《光譜分析在西甜瓜內(nèi)部品質(zhì)無損檢測中的研究進展》
?
相關產(chǎn)品
-
高光譜成像技術精準測試防火材料阻燃隔熱性能
火災頻發(fā),防火材料至關重要 近年來,火災頻發(fā),給人們的生命財產(chǎn)安全帶來了巨大威脅。從居民樓火災到森林大火,每一次火災事故都令人痛心疾首。據(jù)相關統(tǒng)計,僅在過去一..
-
高光譜成像技術對鮮蓮直鏈淀粉含量檢測實驗室研究
高光譜成像技術是一種能獲取豐富光譜和圖像信息的無損檢測技術,相較于化學檢測方法,具有省時、省力、環(huán)境友好的優(yōu)點口。本文將采用高光譜成像技術對鮮蓮直鏈淀粉進行實驗..
-
高光譜相機:開啟紙張分選的精準時代
在環(huán)保日益受到重視的當下,廢紙回收成為了資源循環(huán)利用的關鍵一環(huán)。每年,全球產(chǎn)生的廢紙數(shù)量驚人,據(jù)相關數(shù)據(jù)顯示,僅我國每年紙張消費就呈約 3500 萬噸,若以廢棄..
-
高光譜成像技術牛奶蛋白含量的實驗室研究
牛奶作為人們?nèi)粘I钪兄匾臓I養(yǎng)來源,其蛋白質(zhì)含量是衡量其營養(yǎng)價值的關鍵指標之一。傳統(tǒng)的牛奶蛋白含量檢測方法,如凱氏定氮法、高效液相色譜法等,雖然能夠得到較為準..