基于偏最小二乘法的近紅外光譜定量分析模型預測蛹蟲草中腺苷含量
佚名
作者:李曉光,關澤華,田鴻儒,胡長峰, 孟慶繁
【摘要】 目的采用偏最小二乘法(PLS)建立測定蛹蟲草中腺苷含量的近紅外光譜定量分析模型。方法應用光譜預處理方法分別對蛹蟲草樣品的近紅外光譜進行預處理,并采用預處理后的光譜分別建立定量分析模型。結果經過比較各個模型的內部交互驗證均方根誤差(RMSECV)和交互驗證預測值與真實值間的相關系數(Rv),外部均方根誤差(RMSEP),選取最優的模型,其RMSECV、Rv和RMSEP分別為0.737 6,0.904 9和0.541 0。結論近紅外光譜在中藥有效成分定量分析方面有很大的應用前景。
【關鍵詞】 近紅外光譜 偏最小二乘法 蛹蟲草 腺苷
蛹蟲草Cordyceps militaris(L.ex Fr.)Link又名北冬蟲夏草、北蟲草等[1], 與冬蟲夏草同屬異種,是蟲草屬的模式種,屬于子囊菌亞門蟲草屬,是蛹蟲草寄生在昆蟲綱鱗翅目夜蛾科昆蟲蛹體上所長出的子座與僵死蛹體的復合體。作為一種具有多種藥理功能、抗癌活性的藥用真菌蛹蟲草[2],隨著人們逐漸發現和認識蛹蟲草的滋補療效和提高人體免疫功能的功效,它的開發利用備受世人的極大關注。腺苷是合成三磷酸腺苷(ATP) 的主要原料,ATP 已被廣泛應用于治療心臟功能不全、腦動脈硬化及肌肉萎縮等癥。現行常用的腺苷測定方法主要是高效液相法,該方法具有材料損耗大,測定過程復雜,化學試劑消耗量大且分析時間長等缺點。 隨著光譜學和計算機的發展,近紅外光譜分析技術也得到飛快發展。近紅外光譜技術在建立可靠的校正模型的基礎上,可直接對樣品進行無損檢測,具有分析速度快、效率高、成本低和實現在線檢測等優點,近年來在農業、化工、食品、藥物分析等方面有著廣泛應用[3,4],在中藥材的分類和活性成分分析中還處于起步階段。偏最小二乘法(Partial Least Square, PLS)是目前化學計量學中最有效的分析方法之一。它從自變量矩陣和因變量矩陣中提取偏最小二成分,有效地降維,并消除自變量間可能存在的復共線關系,明顯改善數據結果的可靠性和準確度[5,6]。 本文應用近紅外光譜法結合PLS(NIR-PLS)建立蛹蟲草中腺苷含量的定量分析模型,并用所建模型對預測集樣品進行預測,得到較好的結果,該方法有望成為一種代替現行真菌活性成分測定的快速綠色分析方法。
1.1 材料、試劑與設1 材料與方法備
蛹蟲草(CGMCC 5.699),購于中國科學院微生物研究所; 甲醇(色譜純),葡萄糖,磷酸二氫鉀,硫酸鎂,維生素B1,磷酸氫二鈉,磷酸二氫鈉,均為分析純。日本島津UV-3150型紫外可見近紅外分光光度計,日本島津ISR-3100積分球附件,聯想家悅E3030微型計算機,真空凍干機,德國Eppendorf 5810R型高速冷凍離心機,日本島津LC-10AT高效液相色譜儀。
1.2 樣品光譜的測定
通過化學誘變法獲得478株誘變蛹蟲草菌株,分別通過液體深層發酵獲得不蛹蟲草菌絲體,凍干粉碎過60目篩,制備蛹蟲粉備用;應用積分球,光譜通帶寬度為12 nm,掃描波長范圍800~2 500 nm,每個樣品進行近紅外光譜掃描3次,取平均值作為該樣品的近紅外光譜。
1.3 蛹蟲草腺苷含量的測定
1.3.1 菌絲體腺苷的提取方法
準確稱取0.10 g經預處理后的菌絲體,加蒸餾水在恒溫水浴鍋內浸提一定的時間。8 000 r/ min,離心10 min,分離上清液用于腺苷含量測定。
1.3.2 腺苷含量的測定方法
根據2005版《中國藥典》,利用高效液相色譜法測定腺苷的含量[7]。 流動相為pH 6.5的磷酸鹽緩沖液∶甲醇(體積比)=85∶15。HPLC的測定條件為色譜柱:C-18,流速:1 ml/min,檢測波長:260 nm,柱溫:35℃,進樣量:20 μl。
1.3.3 菌絲體腺苷得率的計算
腺苷得率(W/W)=腺苷質量(mg)/菌絲體質量(g)
1.4 建模標準
將樣品分為校正集和預測集,校正集樣品用于建立校正模型,采用交互驗證的方法檢驗模型的內部穩健性和擬合效果,其評價參數為交互驗證均方根誤差(RMSECV)和交互驗證預測值與真實值間的相關系數(Rv),采用預測集檢驗模型的預測能力,防止模型過擬合,其評價參數為預測均方根誤差(RMSEP),RMSECV和RMSEP的計算方法參如下: RMSE=ni=1(CNIRi-CREFi)n 對于RMSECV,CNIRi為校正集中各組分含量的交互驗證預測值,CREFi為校正集中各組分含量的HPLC測定值,對于RMSEP,CNIRi為模型對預測集樣品中各組分含量預測值,CREFi為預測集中各組分含量的HPLC測定值。
2 結果與討論
2.1 校正集與預測集的選擇
本實驗以367個校正集和111個預測集樣品的光譜數據在第一主成分(PC1)和第二主成分(PC2)上的得分分布見圖 1。由圖 1可以看出預測集樣品較均勻地分布于校正集樣品之中。校正集樣品中HPLC法測定的腺苷含量的值最大值為6.268 mg/g,最小值為0.268 mg/g,平均值為2.783 mg/g;而預測集樣品中HPLC法測定的腺苷含量的值最大值為6.172 mg/g,最小值為0.399 mg/g,平均值為2.924 mg/g。
2.2 光譜預處理方法的選擇
分別采用FFT、卷積平滑、一階導數、二階導數和小波變換對蛹蟲草菌絲體樣品的NIR光譜進行預處理,分別采用預處理后的光譜,在全光譜區域下建立定量分析模型,每個模型經過內部交互驗證和外部預測集的驗證,結果如見表1。表1 不同預處理方法處理后的光譜所建立的定量分析模型的分析結果(略) 通過對表 1分析可知,從模型的穩定性和擬合度角度來考察,原始光譜和在db2函數下尺度為5小波變換處理后的光譜所建立的PLS定量分析模型較好,其RMSECV分別為0.667 5和0.670 7,RP分別為0.906 8和0.904 9。但從模型的預測能力考查,移動窗口為20的一階導數處理后的光譜所建立的PLS模型預測能力最強,RMSEP為0.541 0,明顯低于其他模型。而該模型的穩定性和擬合度與原始光譜和小波變換處理后光譜所建立模型相比,沒有明顯差距。因此本實驗選取一階導數為最佳預處理方法。
2.3 最適主因子數的選擇
使用PLS方法建立定量校正模型時,主因子數的選擇直接關系到模型的實際預測能力。若建立模型時使用的主因子數過少,不能充分反映樣品被測組分產生的光譜信息,導致不充分擬合;若使用主因子數過多則會將一些包含了噪音的信息也摻入計算,就會導致過擬合,從而降低模型的預測能力。本實驗采用留一交互驗證法,考察主因子數對PRESS與RMSECV的影響,當PRESS與RMSECV均最小的時候,所選的主因子數最適。由圖2知,測定蛹蟲草菌絲體中腺苷的PLS定量分析模型的最適主因子數為9。
2.4 最優模型的內部交互驗證
采用最優的條件,建立測定蛹蟲草樣品中腺苷含量的最優模型,對最優模型進行內部交互驗證,結果見圖3所示,腺苷含量的交互驗證預測值與實驗測定值間的相關系數(Rv)為0.904 9,說明模型的擬合效果較好。
2.5 樣品腺苷含量的預測
采用最優PLS定量分析模型對校正集樣品和預測集樣品中腺苷含量進行預測,預測值與HPLC測量值間的相關圖如圖 4所示。由圖 4可以看出,預測值與真實HPLC法測定值相吻合的很好,預測集樣品的腺苷含量的預測值與HPLC方法測定值的相關系數(Rp)為0.938 1。
2.5 樣品腺苷含量的預測
采用最優PLS定量分析模型對校正集樣品和預測集樣品中腺苷含量進行預測,預測值與HPLC測量值間的相關圖如圖 4所示。由圖 4可以看出,預測值與真實HPLC法測定值相吻合的很好,預測集樣品的腺苷含量的預測值與HPLC方法測定值的相關系數(Rp)為0.938 1。
3 討論 本文應用PLS方法結合NIR光譜建立了測定蛹蟲草中腺苷含量的定量分析模型,模型經過校正集樣品的內部的交互驗證和預測集對模型預測能力的檢驗,選擇最適的主因子數,得到最優的PLS定量分析模型,其RMSECV、Rv和RMSEP值分別為0.737 4,0.904 9,0.541 0。該模型具有較好的穩健性、擬合度和較高的預測精度,且方便快捷、無污染、無破壞性,能夠實現在線檢測,可在中藥有效成分檢測方面推廣應用。