基于机器学习的马尾松松花粉提取工艺研究

罗文莉, 刘赛虎, 金莉莉

(延边大学 药学院, 吉林 延吉 133002)

松花粉是马尾松(PinusmassonianaLamb)、油松(PinustabuliformisCarr)、赤松(PinusdensifloraSiebet Zucc)、黑松(PinusthunbergiiParl)等松科植物的花粉[1].松花粉含有油脂、多糖、黄酮类、胆碱、甾醇等多种成分[2-5],其中多糖是松花粉的主要活性物质之一.研究表明,松花粉具有抗炎、抗肿瘤、抗氧化、抗疲劳等作用[6-9].目前,对松花粉的提取及相关研究仍停留在初级阶段[10].2016年,袁桂香等利用正交试验对马尾松松花粉中的多糖进行了工艺优化筛选,但该方法仅仅能对已有的试验水平进行筛选[11],并不能对工艺范围内的最优工艺进行全局求解.机器学习方法因能够有效解决非线性问题以及进行全局寻优,因此近年来被应用于提取工艺的优化中,并取得了良好效果[12].基于此,本文利用正交试验和机器学习两种方法,以松花粉浸膏、多糖提取率和综合评分为指标,对松花粉提取工艺进行优化和对比,以期为松花粉提取工艺的择优选取提供参考.

1.1 材料

马尾松松花粉(产于长白山),经延边大学药学院安仁波教授鉴定;
无水乙醇、葡萄糖、苯酚均为分析纯(天津市科密欧化学试剂有限公司);
浓硫酸(吉林省辽源市西安区化学试剂厂).

1.2 仪器

分析天平,上海精天电子仪器有限公司;
多功能超纯水系统(Unique -R20),厦门锐思捷水纯化技术有限公司;

WZ -180SP旋转蒸发仪,上海申生科技有限公司;

HH-W型恒温水浴箱,江苏省常州市金坛区恒丰仪器厂;
紫外分光光度仪(UV -2450型),岛津公司;
鼓风干燥箱,金坛市恒丰仪器厂;

L -500台式低速自动平衡离心机,上海四科仪器设备有限公司.

2.1 松花粉浸膏的制备

将180 g干燥马尾松松花粉等质量地分为9份后,分别置于9个烧瓶中.采用乙醇回流方法提取马尾松松花粉,并将得到的提取液趁热过滤后再用旋转蒸发仪进行减压浓缩.浓缩后所得的膏体即为浸膏.

2.2 松花粉多糖的提取率测定

2.2.1对照溶液的配置

称取20 mg干燥的葡萄糖置于250 mL容量瓶中,加入超纯水将其定容.取葡萄糖对照溶液2 mL置于试管中,加入2 mL苯酚溶液(质量分数为6%)和5 mL浓硫酸(体积分数为98%)后将试管置于40 ℃的恒温水浴锅中.40 min后取出试管,室温下保存备用.

2.2.2供试溶液的配置

取500 mg松花粉浸膏置于500 mL容量瓶中,加入超纯水定容后超声、离心(3 000 r/min,15 min).将上清液减压浓缩至5 mL后加入15 mL无水乙醇,放置24 h(4 ℃)后离心15 min (3 000 r/min).在离心得到的沉淀中加入少量蒸馏水,沉淀溶解后加入无水乙醇(加入量为溶液体积的3倍)使溶液再次出现沉淀.试验平行3次,并将沉淀物置于干燥箱中烘干(60 ℃,60 min).取5 mg烘干品,研磨后加少量水溶解后转入50 mL容量瓶中定容.取2 mL样品液置于试管中,加入1 mL的苯酚 (质量分数为6%) 和5 mL浓硫酸 (体积分数为98%),静置20 min后摇匀.将上述试管放入恒温水浴锅中水浴15 min (40 ℃),取出后即得马尾松松花粉的多糖供试液[13].

2.2.3标准曲线的绘制

在250 mL容量瓶中,用葡萄糖标准液和超纯水分别配制8.0、12.0、16.0、20.0、24.0、28.0、32.0 μg/mL的标准葡萄糖溶液[14].取1 mL苯酚溶液 (质量分数为6%) 置于7个试管中,然后加入2 mL配制的不同质量浓度的葡萄糖标准液;
充分混匀后加入5 mL浓硫酸 (体积分数为98%),静置10 min后摇匀;
在恒温水浴锅(40 ℃) 中继续静置15 min, 然后在490 nm处测定7组试管的吸光度值[15].测定平行3次,取平均值.利用Origin软件绘制标准曲线(以葡萄糖标准液的浓度为横坐标,以该浓度下测定的葡萄糖吸光度为纵坐标),如图1所示.由图1可知,葡萄糖标准液的浓度(X)和吸光度(Y)之间存在良好的线性关系:Y= 0.014 9X-0.065 6,R2=0.996 2.

图1 苯酚 -硫酸法测定葡萄糖含量的标准曲线

2.2.4松花粉多糖的含量测定

2.2.5加样回收率测定

取3份马尾松松花粉浸膏各50 mg置于试管中,并在浸膏中分别加入不同量的对照品(供试品已知量的80%、100%、120%),然后在490 nm处测定溶液的吸光度和计算其RSD值.经计算,松花粉多糖的平均加样回收率为98.41%,RSD=0.949%.

2.3 工艺数据的处理

本文根据文献[16]中的方法对松花粉的多目标提取工艺进行综合评分,评分公式为S=γ×D+(1-γ)×P, 其中γ为松花粉浸膏的提取权重系数(取0.4), 1-γ为松花粉多糖提取率的权重系数(取0.6).

2.4 正交试验的设计

基于文献[17],本文选取乙醇体积分数、提取温度和提取时间作为影响因素,每个因素均选取3个水平(如表1所示).正交试验L9(33)利用Minitab软件设计.

表1 正交试验的各因素水平

2.5 机器学习的优化算法

图2为利用机器学习方法对松花粉提取工艺进行优化的流程图.优化时,将正交试验所得的数据作为人工神经网络(artificial neural network,ANN)的训练数据集,并对训练后的数据进行皮尔逊相关性分析(Pearson correlation analysis),以此得到各个工艺参数的影响权重.为使神经网络模型能够快速收敛,对数据进行归一化处理,并在训练过程中采用K折交叉验证(K-fold cross validation)的方式对模型进行评估,以此确保模型的泛化能力.

图2 利用机器学习的松花粉提取工艺优化流程

利用Python语言中的Pytorch框架构建BP(back propagation)神经网络[18],并利用该网络对马尾松松花粉正交试验提取的数据进行训练和预测.训练时,交叉验证的K折数设定为6, 遍历次数取2 000, 优化器选用Adam, 学习率设定为0.01.在不同目标下对松花粉浸膏提取、多糖提取和综合评分进行网络结构分析,所得的结果见表2.

表2 不同目标下的网络结构

由于遗传算法在优化数据时需给定目标函数和约束条件,因此本文根据浸膏提取、多糖提取及综合评分的正交试验结果给出如下约束条件:
60% ≤ 乙醇体积分数 ≤ 90%, 40 ℃ ≤ 提取温度 ≤ 90 ℃, 0.75 h ≤ 提取时间 ≤ 3.2 h.迭代数据,并将种群规模设置为1 000, 最大进化代数设置为500, 重组概率设置为0.7.

3.1 正交试验方法的相关性分析

正交试验结果如表3所示.由表3可以看出,影响浸膏提取、多糖提取及综合评分的因素其大小顺序依次为乙醇体积分数、提取时间、提取温度.

图3为浸膏、多糖提取率及综合评分的主效应图.由图3可知:当乙醇体积分数为90%、提取温度为85 ℃,提取时间为3 h时,松花粉浸膏的提取率最高;
当乙醇体积分数为80%、提取温度为75 ℃,提取时间为3 h时,松花粉多糖的提取率最高;
当乙醇体积分数为80%、提取温度为85 ℃,提取时间为3 h时,综合评分最高.

表3 正交试验结果

注:R为正交试验的极差值(由Minitab软件计算得出).

图3 浸膏、多糖提取率及综合评分的主效应图

3.2 机器学习方法的预测结果

图4为松花粉提取工艺的皮尔逊相关性分析图.由图4可知,影响两种方法(正交试验法和机器学习方法)的权重(浸膏提取率、多糖提取率和综合评分的权重)其顺序均相同,即由大到小的顺序均为乙醇浓度、提取时间、提取温度.

图5为基于BP网络的马尾松松花粉浸膏、多糖提取率和综合评分的响应图.由图5(a)和图5(b)可以看出,乙醇体积分数为80%时,浸膏提取率随提取温度或提取时间的增加而增加;
由图5(c) 可以看出,当提取温度为75 ℃时,浸膏提取率随提取时间的增加呈先上升后下降的趋势;
由图5(d)和图5(e) 可以看出,提取温度为75 ℃或提取时间为2.5 h时,多糖提取率随着乙醇体积分数的增加呈先上升后下降的趋势;
由图5(f) 可以看出,提取温度为75 ℃时,多糖提取率随提取时间的增加而增加;
由图5(g)和图5(h)可以看出,提取温度为75 ℃或提取时间为2.5 h时,多糖提取率随乙醇体积分数的增加呈先上升后下降的趋势;
由图5(i)可以看出,提取温度为75 ℃时,综合评分随提取时间的增加而增加.

图4 松花粉提取工艺的皮尔逊相关性分析图

图5 基于BP网络的马尾松松花粉浸膏、多糖提取率和综合评分的响应图

3.3 试验工艺验证

图6为种群个体目标函数值随代数变化的曲线.由图6可知,经过20次迭代后,遗传算法已找到最优工艺值.表4为正交试验和机器学习的优化结果及验证值.由表4可知,以松花粉浸膏为指标时,机器学习方法获得的松花粉浸膏的优化验证值为21.06% (提取工艺为乙醇体积分数90%、提取温度65 ℃、提取时间3.2 h) ,正交试验的验证值为20.98%;
以松花粉多糖为指标时,机器学习方法获得的多糖提取率的优化验证值为2.74%(提取工艺为乙醇体积分数81%、提取温度89 ℃、提取时间3.2 h),正交试验的验证值为2.61%;
以松花粉综合评分为指标时,机器学习方法获得的综合评分优化验证值为92.01% (提取工艺为乙醇体积分数83%、提取温度89 ℃、提取时间3.2 h),正交试验的验证值为89.78%.上述结果表明,机器学习法的提取率显著优于正交试验法,且所得的提取率相对稳定.

图6 种群个体目标函数值随代数变化的曲线

表4 正交试验和机器学习的优化结果及验证值

本文利用正交试验设计和机器学习两种方法,对马尾松松花粉提取工艺进行对比研究显示:以松花粉的浸膏、多糖提取率及综合评分为评价指标时,采用机器学习方法获得的松花粉浸膏、多糖提取率和综合评分显著优于正交试验设计方法,这表明机器学习可用于非线性的复杂问题的拟合,且使用该方法求解得到的极值通常为工艺的最优解.该方法同时具有良好的稳定性,并可降低试验费成本和时间,因此可为松花粉的工业化提取提供参考.在今后的研究中,我们将对马尾松松花粉多糖的生物活性进行研究,以促进马尾松松花粉的开发和利用.

猜你喜欢 松花粉浸膏马尾松 松花粉多糖对免疫调节作用的影响研究生物化工(2021年4期)2021-01-19马尾松栽培技术及抚育管理绿色科技(2019年5期)2019-11-29青橄榄浸膏的提取及其抗氧化活性研究天然产物研究与开发(2019年1期)2019-03-01松花粉的主要活性成分及其功能的研究进展食品研究与开发(2019年9期)2019-02-16中药浸膏粉吸湿性的评价方法中成药(2017年5期)2017-06-13新一代破壁饮食与健康·下旬刊(2016年9期)2016-05-14新一代破壁养生保健指南(2016年8期)2016-05-14马尾松果糖-1,6-二磷酸酶基因克隆及表达模式分析广西林业科学(2016年1期)2016-03-20马尾松初级种子园复壮技术广西林业科学(2016年1期)2016-03-2024年生马尾松种子园自由授粉子代测定及家系选择广西林业科学(2016年1期)2016-03-20

推荐访问:马尾松 提取 松花粉