当前位置: 首页 > 期刊 > 《中国新药杂志》 > 2000年第3期
编号:10275182
聚类分析法在中成药成分分析中的应用
http://www.100md.com 《中国新药杂志》 2000年第3期
     作者:王兆基 关锡耀

    单位:香港特别行政区政府化验所

    关键词:中成药成分分析;聚类分析法;气相色谱图

    中国新药杂志000308 摘要 中成药成分分析是一件艰巨且复杂的工作,文献中多以薄层层析法为分析手段,虽然此法有成本低和操作简单等优点,但在应用上仍有不少的限制。本文介绍一种化学模式识别方法——聚类分析法,配合一个自编的电脑计算程序,可以比较简单且快捷地进行中成药成分分析。

    COMPONENT ANALYSIS OF CHINESE PROPRIETARY MEDICINES

    BY CLUSTER ANALYSIS TECHNIQUE

    Wang Zhaoji Guan Xiyao
, 百拇医药
    (Government Laboratory, HKSAR)

    ABSTRACT Component analysis of Chinese proprietary medicines is a complicated and difficult task. In literature, thin layer chromatography was frequently applied for the analysis of proprietary medicines because of low cost and simplicity. However, there are some restriction in applying this technique to the component analysis of proprietary medicines. In this paper, a simple pattern recognition technique——cluster analysis, was introduced. And with the use of an in-house computer program, the technique could provide a rather simple and rapid means for the component analysis.
, 百拇医药
    KEY WORDS Component analysis of Chinese proprietary medicine; Cluster analysis; Gas chromatogram

    中药的应用已有5 000年历史之久,主要以煎药的形式服用,但近年来,有不少的中药处方开始以不同的成药制剂方式来配制和销售。根据统计数字,市面上已有近4 000种中成药制剂出售,若要对这些中成药制品进行注册和监管,一套有效和快捷的成分分析方法是必须的。

    中成药成分分析是一件艰巨且复杂的工作,文献中多以薄层层析法作为分析手段,虽然此法有成本低和操作简单等优点,但在实际应用上仍有不少限制。例如须要掌握不同药材的指标成分,并要取得有关对照品作分析之用;另外,提取过程及层析分析系统会因不同的指标成分而有所不同;再者,一般中成药都由好几种药材合制而成,令其成分提取和分析更加复杂。因此,若要采用薄层层析法对4 000种中成药进行成分分析,将会是一件非常花费人力和时间的工作。
, 百拇医药
    本文建议应用模式识别方法进行中成药成分分析,通过比较和分析中成药样本及药材的气相色谱数据,去辨别出样本中是否含有某种中药材成分。

    1 仪器与试剂

    仪器:美国 Hewlett Packard HP5890A 气相色谱仪,HP7673A自动进样器,HP3396积分仪;美国IBM PC 340个人电脑。中药材对照品:购自中国药品生物制品检定所。中成药样品:购自中国国货公司。试剂:氯仿,磷酸氢钾为分析纯,水用重蒸馏水。

    2 实验方法

    2.1 样品的提取 取磨成粉末之中药材或中成药样本1.0g,置于45ml离心试管中,加入10ml磷酸缓冲液(17.4g磷酸氢钾K2HPO4溶于450ml水中)后摇匀,再加入25ml氯仿,高速均匀提取,后用离心机分离(2 000r/min, 15min),移取氯仿提取液至250ml圆底烧瓶内,用氯仿重复提取2次,将氯仿提取液置于同一圆底烧瓶内,于真空中加热(35~40℃)以挥发溶剂,残余溶于1ml氯仿中作气相色谱分析用。
, 百拇医药
    2.2 气相色谱条件 毛细管色谱柱为美国Supelco SPB-1,30mm×0.53mm;进样和检测器温度为柱温:120℃保持5min,然后以5℃/min,加温至280℃,最后保持在280℃中25min;检测器为火焰电离检测器;进样1μl。

    3 聚类分析法

    聚类分析法本身是一种属于无监督学习系统的化学模式识别方法,在特征空间中直接寻找点群或其他可识别的数据结构,进行样本的归类。此法亦曾应用于药材的鉴别和分类,应用于中成药成分分析。首先要选取合适的方法去提取药材的特征数据,以多维特征空间表达出来,再把中成药样本所得数据投影到这个特征空间上,根据点群的分布进行归类。

    在同一萃取及气相色谱条件下,本法观察所得不同药材会得到不同特征色谱图,其数据结构可满足聚类分析的要求,分析程序如下:把有m个色谱峰的目标药材色谱图表达于一个m维特征空间,然后把能与药材色谱峰配对的中成药色谱峰投影到这m维特征空间上,配对的准则是看中成药色谱峰的保留时间是否介于某目标药材色谱峰的保留时间加减1%的范围内。如此重复分析不同的中成药样本,按所得投影点群的分布,判断哪些样本含有这目标药材成分。
, http://www.100md.com
    但在应用上,仍有其他需要考虑的地方。例如,若目标药材超过3个以上色谱峰,所对应的特征空间会是一个高维空间,不易于观察;另外,不是每一个色谱峰在药材识别上有同样贡献,所以不能单单按目标药材色谱峰的数目去指定一个特征空间;再者,在分类特征空间上的点群时,最好能有一个可以量化的准则,而不是纯粹靠主观观察。为此,本实验建议通过主成分分析方法分析一些实例样本数据,去找出以不同目标药材色谱峰组合而成的主因子,作为新特征空间不同的方向。这样,可以把原先的特征空间降维至二维或三维,便于观察;另外,这些主因子可反映出不同目标药材色谱峰在识别功用上不同的贡献;最后,通过测量同类样本投影点之间距离,可以计算出一些统计量作为判定标准。

    为要检验以上方法的可行性,本实验选取8种常用的药材,作为目标药材,另选取12种中成药作为样本。在制备实例样本时,再选取5个药材(甘草、天麻、叁七、白芍、黄芪)作样本中附加的背景干扰。实例中共有15个不同样本,各由3~6个药材的提取液(从8个目标药材及另加的5个药材中随意选取),以不同比例混合组成。对应每一个目标药材,实例样本都可分成2组:A组样本全都有这目标药材成分;而B组样本中则没有,见表1。
, http://www.100md.com
    表1 8种被选用作目标药材的中药材名称及其在中成药中使用率 药材名称

    药材学名

    使用率(%)a

    当 归

    Radix Angelicae Sinensis

    17.5

    川 芎

    Rhizoma Chuanxiong

    11.2

    白 术

    Rhizoma Atractylodis Macrocephalae
, http://www.100md.com
    8.1

    陈 皮

    Pericarpium Citri Reticulatae

    7.5

    白 芷

    Radix Angelicae Dahuricae

    7.4

    大 黄

    Radix Et Rhizoma Rhei

    7.3

    五味子

    Fructus Schisandrae
, 百拇医药
    7.0

    防 风

    Radix Saposhnikoviae

    6.8

    a:根据普查2 053个中成药的药材成分而所得资料4 数据处理

    对应每一个目标药材,先组成一个数据矩阵X如下:

    式中k是目标药材的色谱峰数目,m是实例中对应这个目标药材的A组样本数目,而n则是B组样本数目。若第i个实例样本中可找到有一个峰能与目标药材的第j个色谱峰配对的话,设Xi,j的值为该峰的峰面积,否则设Xi,j的值为零。
, 百拇医药
    接着把矩阵X的数据标准化,得数据记为Zi,j,即

    其中

    再从矩阵Z方兴未艾算协方差阵D,即

    从矩阵D求解其本征矩阵α及对应本征矢量λ,即 D.α=λ.α

    其中
, http://www.100md.com
    及

    α矩阵的每一个列称为一个主因子,而对应此列的λ值则为此主因子的方差贡献份数。一个主因子的方差贡献份数愈大,它在药材识别上的贡献就愈大。为要达到降维的效果,我们不必选取所有k个主因子,只须取前P个主因子使其累积方差贡献份数百分比>80%就可以,即

    然后把实例样本投影到以这P个主因子所构成的特征空间上,计算方见以下公式

    式中Yi,l是第i个实例样本的投影点与第l个主因子方向轴的距离,而Xi,j及αl,j则分别是X和α矩阵的对应元素。最后,可以得到一幅如图1的聚类分析图,我们会发现B组实例样本的投影点聚合成一个点群;而A组实例样本的投影点则扩散于这个点群以外的空间上,样本中目标药材含量愈高,它的投影点离开B组样本的点群愈远。所以,由各B组实例样本的投影点与其点群的中心点之间的距离hi,可得距离均值及距离方差Sh等统计量,藉此可拟定一个范围空间把包含与不包含这目标药材的两类样本分隔开。设一测试样本在这特征空间的投射点与点群的中心点之间的距离yj,若
, http://www.100md.com
    可判断样本为含有这个目标药材。

    5 结果与讨论

    文中采用的萃取方法,是参考美国药典用于提取植物样本中生物碱的方法,除了生物碱之外,植物中其他的有机化合物也会同时被提取出来,且选用的溶剂氯仿,有萃取能力强及易于浓缩等特点。致于数据结构方面,我们选用气相色谱方法,是因为它能提供高解析度的色谱图,而且气相色谱峰的重现性及精确性也非常好。

    数据处理方面,由于大量及复杂的矩阵运算困难,所以利用美国Math Works公司的MATLAB软件(版本5.0)所提供的程序编写功能,自编一个聚类分析用的程序。运算上,用者只须输入目标药材、实例样本及中成药样本的色谱图资料(色谱峰的保留时间和峰面积),就可以直接得到聚类分析的结果,非常简单快捷。 用此聚类分析方法测试了12个中成药样本,结果详见表2。结果显示,此法的准确度为67%~92%,平均为78%;而第1类误差和第2类误差的平均值则分别为11% 和10%。第1类误差是指样本标明没有某种目标药材,但分析结果却认为是有的;而第2类误差是指样本标明有某种目标药材,但分析结果却认为是没有的。
, 百拇医药
    表2 12个中成药样本的聚类分析结果 中成药

    白术

    大黄

    陈皮

    川芎

    当归

    白芷

    防风

    五味子

    鼻炎片

    +

    -

    +a
, 百拇医药
    -

    -

    +a

    -a

    -a

    化痰止咳丸

    -

    -

    +

    -

    -

    -

    +
, 百拇医药
    +

    广东捷步虎潜丸

    -

    +

    -a

    -

    -a

    -

    -

    -

    天王补心丸

    -

    -
, 百拇医药
    -

    -

    -a

    -

    -

    -a

    川芎天麻头痛丸

    -

    +

    -

    -a

    -

    -
, http://www.100md.com
    -

    +a

    补中益气丸

    +a

    -

    -a

    -

    +a

    -

    -

    +

    兰州健步虎潜丸

, http://www.100md.com     +

    -

    +a

    -

    +a

    -

    -

    -

    十全大补丸

    +a

    -

    -

    +a
, 百拇医药
    -a

    -

    -

    +

    香砂养胃丸

    +a

    -

    +a

    +

    -

    -

    -

    -
, 百拇医药
    天麻头痛丸

    -

    -

    -

    -

    -

    -

    -

    +a

    降脂收腹减肥丸

    -

    +a

    +
, 百拇医药
    -

    -

    +

    -

    -

    川芎茶调散

    -

    -

    -

    + a

    -

    + a

    - a

    -

    a:表示样本中列明含有对应目标药材;“+”表示聚类分析结果为样本中含有对应目标药材;“-”表示聚类分析结果为样本中不含有对应目标药材 虽然以上的测试结果未算完善,但作为一个初步的尝试,结果尚令人满意,起码也不失为一个简单快捷的预检中成药成分的方法,可减少测试大量样本时所需人力和时间。遇到分析结果有疑问的时候,才需考虑其他分析方法。

    收稿:1999-09-15

    修回:2000-01-14, http://www.100md.com