当前位置: 首页 > 期刊 > 《数理医药学杂志》 > 1999年第3期
编号:10261363
多变量统计分类技术进行甲氧苄胺嘧啶质量控制的研究
http://www.100md.com 《数理医药学杂志》 1999年第3期
     作者:任玉林 李伟 郭晔 任瑞雪 张璐** 靳丹红** 李梅**

    单位:任玉林 李伟 郭晔 任瑞雪 张璐** 靳丹红** 李梅**(吉林大学化工学系 长春130023)

    关键词:质量控制;近红外反射一阶导数光谱;多变量统计分类技术;甲氧苄胺嘧啶;粉末药品

    990347

    摘 要 研究了近红外反射一阶导数光谱法进行甲氧苄胺嘧啶粉末药品质量控制的可能性。用多变量统计分类技术(系统聚类分析、逐步聚类分析、主成分分析和逐步判别分析),从甲氧苄胺嘧啶粉末药品的近红外反射一阶导数光谱,成功地鉴别了合格、劣和假药,结果令人满意。

    用近红外反射光谱法解决药品的无损分析,目前在国际上正成为热门课题。随着计算机各类软件的开发,多变量统计分类技术的发展,信噪比已达106的近红外光谱仪的出现,促进了固态样品进行非破坏无损分析药品得以实现。近几年,已被应用于原料药、药品包装材料、多晶、光光异构体的测定以及进行制剂的定性和定量分析[1,2],进行无损的胶囊片剂分析的论文已经出现[3]
, http://www.100md.com
    本研究是利用NIR进行药品分析系列研究的一部分。按照处方,先从配伍的粉末药品的分析入手,最终达到直接进行胶囊片剂的非破坏性的无损分析。本文依据甲氧苄胺嘧啶粉末药品的近红外反射一阶导数光谱,应用系统聚类分析、逐步聚类分析、主成分分析和逐步判别分析等多变量统计分类技术,进行甲氧苄胺嘧啶的质量控制方法的研究。

    1 实验部分

    1.1 仪器和试剂

    日本岛津产UV-3100型紫外可见近红外分光光度计,附近ISR-3100积分球。长城386微机通过接口和分光光度计连接,自动采集、传输数据。奔腾586微机处理光谱数据。

    甲氧苄胺嘧啶、淀粉和硬脂酸镁均符合药典标准。

    1.2 样品制备

    根据处方制备主药甲氧苄胺嘧啶符合标示量的“合格药”28个,编号1~28;甲氧苄胺嘧啶含量较低的“劣药”7个,编号29~35;不含甲氧苄胺嘧啶的“假药”5个,编号36~40。有关数据见表1。
, 百拇医药
    表1 甲氧苄胺嘧啶药品含量(% W/W)

    甲氧苄胺嘧啶

    淀 粉

    硬脂酸镁

    最大

    最小

    平均

    最大

    最小

    平均

    最大

    最小

    平均
, 百拇医药
    合格药

    (28)

    77.10

    69.86

    73.58

    29.44

    22.17

    25.71

    1.25

    0.51

    0.75

    劣 药

    (7)
, 百拇医药
    65.04

    49.90

    59.73

    49.50

    34.26

    39.48

    1.03

    0.57

    0.78

    假 药

    (5)

    0

    0
, http://www.100md.com
    0

    99.25

    98.76

    99.03

    1.24

    0.75

    0.97

    1.3 测定条件

    狭缝12nm;扫描范围1300~2500nm;每个样品扫描2次,取平均值;间隔15nm采集一光谱数据,则每个样品有81个吸光度值或一阶导数数据。

    1.4 光谱数据处理

    系统聚类分析、逐步聚类分析、主成分分析和逐步判别分析原理详见文献[4,5]。用本实验室编辑的程序处理数据,进行多变量统计分类。
, http://www.100md.com
    2 结果与讨论

    2.1 近红外反射光谱、一阶和二阶导数光谱

    甲氧苄胺嘧啶、淀粉和硬脂酸镁纯组分的近红外反射光谱、一阶和二阶导数光谱见图1中A、B和C所示。可以看出,三组分的反射光谱重叠严重,而二阶导数光谱的各峰分辨较好,但较一阶导数光谱的信号强度弱得多。综合考虑,采用一阶导数光谱数据进行多变量统计分类为宜。

    1.甲氧苄胺嘧啶;2.淀粉;3.硬脂酸镁

    图1 (A)近红外反射光谱;(B)一阶导数光谱;(C)二阶导数光谱
, 百拇医药
    2.2 系统聚类分析

    聚类分析是按“物以类聚”的思想将较为相似或较为接近的事物归到一起而形成的一种统计分类方法。常用的是系统聚类法,依据一种事先选定的相似性或非相似性度量(距离)和类间距离,经过计算建立谱系图,再根据谱系图决定分类结果。

    将光谱数据用平方欧氏距离和Wald(类平均)类间距离计算所得的谱系图见图2。可以看出,假药和合格劣药完全正确并清楚地分成两大类,而合格药和劣药又分成了两类。

    2.3 逐步聚类分析

    逐步聚类法(或称动态聚类法)是依据各分类对象在多维空间(维数由变量数决定)的位置和各类的中心(即重心,亦称凝聚点)间的距离进行分类的一种迭代方法。每步迭代都对各类的中心进行调整并将分类对象按与各中心的距离之远近进行归类,直到不变为止[6]
, http://www.100md.com
    光谱数据按逐步聚类法确定三个中心,各样品点与三个中心的距离计算出并列于表2。当距离1<距离2<距离3,该样品为合格药;当距离2<距离1<距离3,样品为劣药;当距离3<距离2<距离1,样品为假药。根据距离远近分类的结果与实际情况完全相符。

    图2 系统聚类分析的谱系图

    表2 逐步聚类结果 No.

    距离1

    距离2

    距离3

    聚类

, 百拇医药     1

    14.5409

    53.9765

    487.8619

    1

    2

    22.0810

    50.8987

    477.1946

    1

    3

    31.6994

    57.5513
, http://www.100md.com
    503.6811

    1

    4

    26.2302

    67.7322

    529.1981

    1

    5

    20.2126

    62.2789

    489.1020

    1

    6
, 百拇医药
    31.5267

    75.1445

    550.0643

    1

    7

    21.7022

    63.3134

    488.5715

    1

    8

    30.2065

    82.3711

    571.7186
, 百拇医药
    1

    9

    27.2929

    58.9831

    488.9142

    1

    10

    34.3453

    72.9458

    506.8010

    1

    11

    22.8539
, 百拇医药
    52.7550

    473.6975

    1

    12

    44.7690

    81.4369

    544.2202

    1

    13

    26.6350

    61.1292

    474.9512

    1
, 百拇医药
    14

    26.1402

    53.8614

    498.1863

    1

    15

    36.7405

    76.1658

    461.1808

    1

    16

    29.2347

    64.2009
, 百拇医药
    430.3082

    1

    17

    35.3703

    73.7979

    469.7393

    1

    18

    27.3214

    52.6531

    453.9574

    1

    19
, 百拇医药
    27.1595

    47.3272

    453.1505

    1

    20

    40.3461

    69.5271

    459.2830

    1

    21

    35.2250

    66.2675

    452.5220
, 百拇医药
    1

    22

    27.2183

    48.4777

    430.7813

    1

    23

    37.2355

    70.9139

    494.1838

    1

    24

    33.0763
, 百拇医药
    54.8007

    451.3196

    1

    25

    28.8164

    70.3896

    478.1626

    1

    26

    34.1945

    60.8428

    463.4740

    1
, 百拇医药
    27

    24.5218

    44.9605

    432.7730

    1

    28

    29.2619

    59.7944

    438.1594

    1

    29

    42.7856

    30.5273
, http://www.100md.com
    372.0201

    2

    30

    49.5193

    36.1648

    369.1670

    2

    31

    67.4571

    31.1438

    306.9132

    2

    32
, 百拇医药
    60.8446

    25.6180

    295.3573

    2

    33

    79.8884

    37.2534

    320.0492

    2

    34

    79.0598

    37.8406

    283.2586
, 百拇医药
    2

    35

    86.0411

    32.4132

    218.8552

    2

    36

    457.5534

    287.4530

    26.7654

    3

    37

    494.2199
, 百拇医药
    311.5930

    34.5955

    3

    38

    465.8199

    288.4266

    21.6964

    3

    39

    475.8874

    304.5871

    22.9961

    3
, 百拇医药
    40

    489.5162

    316.1944

    20.3008

    3

    2.4 主成分分析

    主成分分析是一种简化数据结构、突出主要矛盾的多变量统计分类方法。它能将原来较多的变量转化为少数几个主要成分并能突出地反映事物的规律性。我们所研究的问题,每个样品有81个光谱数据(变量),从这么多的数据的对比中区分样品的真伪,主成分恰好能发挥它的作用。

    光谱数据用主成分分析算出的结果是第一主成分和前两个主成分的累积贡献分别达0.62和0.66。以第一主成分为横座标,第二主成分为纵座标,绘图如图3所示。其中合格、劣和假药分别用记号×、△和+表示。可见,假药和合格劣药的划分异常清楚,而真劣两药地区分开了。每个主成分都是81个变量的线性组合。用计算机计算每个样品的得分,再按其在平面上的位置,大体上判定药品的合格、劣和假药,当然是轻而易举的事。但主成分分析不便于用公式将其写出并用于手工计算。
, 百拇医药
    图3 样品在前两个主成分上得分的分布

    2.5 逐步判别分析

    逐步判别分析法能在筛选变量的基础上建立线性判别模型。筛选是通过F检验逐步进行的。每一步选取满足指定水平最显著的变量并剔除因新变量的引入而变得不显著的原引入的变量,直到既不能引入也不能剔除为止。

    经反复尝试,我们将引入和剔出的F水平值取为5(大致相当于90%以上的置信概率),所得的判别函数的有关数据列于表3。经6步筛选后,最后选定的变量所对应的波长为:

    表3 判别函数 变量

    偏F

    Y1

    Y2
, 百拇医药
    Y3

    X(38)

    32.627

    1917.901

    -2701.979

    -6315.719

    X(70)

    11.059

    8080.778

    14801.856

    11953.097

    X(21)
, 百拇医药
    12.327

    1350.376

    3541.833

    2463.434

    X(15)

    6.939

    220.871

    -1602.566

    -1912.835

    X(42)

    6.981

    -1705.989
, 百拇医药
    2863.973

    9912.853

    X(17)

    6.177

    -1036.585

    538.801

    4599.391

    常数

    -143.001

    -111.495

    -141.209

    X(38):1855nm X(70):2335nm X(21):1600nm
, http://www.100md.com
    X(15):1510nm X(42):1915nm X(17):1540nm

    相对应的三个判别函数为:

    Y1=-143.001+220.871X1510-1036.585X1540+1350.376X1600+1917.901X1855-1705.989X1915+8080.778X2335

    Y2=-111.495-160.266X1510+538.801X1540+3541.833X1600-2701.979X1855+2863.973X1915+14801.856X2335
, 百拇医药
    Y3=-141.209-1912.835X1510+4599.391X1540+2463.434X1600-6315.719X1855+9912.853X1915+11953.097X2335

    将待查药品在上述波长测得的光谱数据代入三个判别函数式,算得三个得分Y1、Y2和Y3,如表4所示。若Y1>Y2>Y3,则样品为合格药;若Y2>Y1>Y3,样品为劣药;若Y3>Y2>Y1,样品为假药。40个样品算出的得分按其相对大小判定的结果与实际情况完全相符。与前三个方法比较,在逐步判别法中,三个判别函数是6个变量的线性函数,易于手工计算,是判别甲氧苄嘧啶粉剂的合格、劣和假药的最实用的方法。
, 百拇医药
    表4 逐步判别结果 No.

    得 分

    判别

    Y1

    Y2

    Y3

    1

    144.357

    105.554

    -198.883

    1

    2
, 百拇医药
    146.399

    93.243

    -231.932

    1

    3

    148.728

    102.074

    -220.895

    1

    4

    168.489

    131.446

    -197.346
, http://www.100md.com
    1

    5

    130.504

    87.798

    -211.634

    1

    6

    167.683

    117.037

    -220.207

    1

    7

    151.736
, 百拇医药
    1103.791

    -213.447

    1

    8

    181.055

    128.010

    -218.921

    1

    9

    140.002

    104.393

    -207.751

    1
, 百拇医药
    10

    147.461

    103.048

    -218.903

    1

    11

    123.892

    78.971

    -232.811

    1

    12

    174.439

    126.263
, 百拇医药
    -225.428

    1

    13

    143.633

    96.269

    -231.227

    1

    14

    157.376

    114.543

    -203.059

    1

    15
, http://www.100md.com
    128.071

    100.174

    -197.226

    1

    16

    123.364

    77.097

    -234.009

    1

    17

    140.871

    110.613

    -186.846
, http://www.100md.com
    1

    18

    132.146

    99.668

    -192.875

    1

    19

    145.712

    118.032

    -200.032

    1

    20

    130.140
, 百拇医药
    95.411

    -204.896

    1

    21

    126.922

    89.313

    -200.125

    1

    22

    140.710

    100.727

    -207.637

    1
, http://www.100md.com
    23

    147.794

    114.750

    -207.059

    1

    24

    144.583

    105.084

    -203.599

    1

    25

    135.357

    86.699
, 百拇医药
    -236.435

    1

    26

    134.028

    101.577

    -196.299

    1

    27

    120.912

    73.647

    -219.878

    1

    28
, 百拇医药
    127.670

    86.963

    -217.945

    1

    29

    105.008

    136.625

    -81.910

    2

    30

    87.602

    110.778

    -112.305
, http://www.100md.com
    2

    31

    89.332

    120.581

    -91.876

    2

    32

    66.682

    103.317

    -93.180

    2

    33

    61.436
, 百拇医药
    129.408

    -29.012

    2

    34

    51.133

    96.141

    -71.770

    2

    35

    31.315

    83.618

    -57.754

    2
, http://www.100md.com
    36

    -207.460

    -45.515

    132.711

    3

    37

    -211.121

    -45.896

    126.157

    3

    38

    -212.372

    -45.724
, 百拇医药
    139.619

    3

    39

    -218.351

    -40.899

    163.212

    3

    40

    -219.890

    -57.547

    144.344

    3

    参考文献
, http://www.100md.com
    1 Dressi E, Ceramelli G, Corti P. Analyst, 1995,120:1005.

    2 Rimband D J, Walczak B, Massare D L, Last I, Prebble K A Analytica Chimica Acta, 1995,304:285.

    3 Dempster M A, MacDonald B F, GempeHine P, Boyer V R. Analytica Chimica Acta, 1995, 310:43.

    4 Pedro J M, Maria D C, Alberto H J. Sci. Food Agric, 1988,45:34.

    5 Hernandez C Z Z, Rutledge D N. Analysis, 1994,119:1171.

    6 周光亚,赵文,赵振全,姜诗章.多元统计分析法.长春:吉林大学出版社,1988.

    收稿日期:1997-10-20, 百拇医药(任玉林 李伟 郭晔 任瑞雪 张璐** 靳丹红** 李梅**)