当前位置: 首页 > 期刊 > 《分析化学》 > 2006年第9期
编号:11201543
基于支持向量机的羰基化合物红外光谱研究
http://www.100md.com 《分析化学》 2006年第9期
红外光谱,支持向量机,人工神经网络,信息提取,羰基,酰胺,,红外光谱,支持向量机,人工神经网络,信息提取,羰基,酰胺,1引言,2方法原理,3结果与讨论,4
     摘要 设计了一个4层分等级分类系统,通过支持向量机技术对羰基化合物的红外光谱成功地进行了信息分类和提取,并与人工神经网络进行比较,结果表明:支持向量机对羰基类化合物红外光谱分类效果优于人工神经网络;另外详细探讨了表征酰胺类化合物的特征光谱峰片段对识别伯仲叔酰胺的影响,证明了酰胺的NH伸缩振动峰对识别伯仲叔酰胺贡献最大,为构建红外光谱智能解析系统提供了定量依据。

    关键词 红外光谱,支持向量机,人工神经网络,信息提取,羰基,酰胺

     1 引言

    红外光谱能反映物质结构特征,具有高度的特征性,是进行化合物定性及定量分析的重要依据。目前利用红外光谱提取化合物结构信息的手段主要有:谱图库检索、专家系统以及模式识别方法[1~5]。其中应用最多的模式识别方法主要有人工神经网络(ANNs)[4]以及偏最小二乘(PLS)[5]。ANN具有强大的非线性建模能力,经过十多年的发展成为在光谱解析中应用最多也相对成熟的技术。但是这些方法对红外光谱子结构的识别率都不高,另外ANN不稳定,易陷入局部极小以及收敛速度慢等缺点限制了其在红外光谱领域的应用。为了解决这些问题,实验引入新近出现的基于统计学习理论的支持向量机(SVM),利用其对红外数据库中含羰基化合物的红外光谱进行分类,并将其结果与人工神经网络比较,另外着重探讨了酰胺类化合物的特征光谱峰片段与其化学结构的关联。

    2 方法原理

    2.1 SVM分类原理

    支持向量机[6]是建立在统计学习理论(SLT)基础上的一种机器学习算法。SVM算法是一个凸二次优化问题,基于结构风险最小化原理,能够保证极值解是全局最优解,避免了ANN等方法的网络结构难于确定、过拟合和欠拟合以及局部极小等问题,在很大程度上表现出优于已有统计方法的性能,其在解决光谱学实际问题中也已得到应用[7~10]。

    训练样本集假定为{(xi, yi), i=1,2,…,l},其中xi∈RN为输入值,yi∈R为对应的目标值, l为样本数。对于两类非线性问题,SVM首先通过引入核函数将输入变量映射到一个高维特征空间,在高维空间中构造最优分类超平面(MMH),该超平面通过解决如下的二次规划问题得到:

    Maxl[]i=1ai-1[]2l[]i=1l[]j=1aiajyiyjK(xi,xj)(1)

    约束条件:l[]i=1aiyi=0, (0≤ai≤C)(2)

    其中C为正则化参数,它控制对错分样本的惩罚程度,K(xi,xj)为核函数,本研究所选用的核函数为径向基核函数(RBF):K(xi,xj)=exp{-1[]2σ2‖x-xi‖2}(3) 其中σ为核函数宽度 ......

您现在查看是摘要页,全文长 9962 字符