广义规则归纳算法在肺炎患儿病原分析中的应用研究
合胞,支原体,1资料与方法,2结果,3讨论
毛晓健,王和勇肺炎是5岁以下儿童第1位的死亡原因[1]。通过对肺炎患儿临床特征的分析帮助了解其分布特征与规律,对儿童肺炎的临床防治工作有着重要意义。关联规则是数据挖掘中一种重要的研究方法,其优点是能够发现数据中存在的隐含知识。关联规则已经被应用于临床医学研究中,且大多运用Apriori算法进行关联规则分析研究[2-6]。广义规则归纳 (GRI)是关联规则中算法的一种[7],该算法的基本思路是依据深度优先搜索策略进行分析,可更有效地发现数据中存在的隐含信息,以帮助发现数据中隐藏的规律。将GRI算法用于临床数据分析中的文献不多[8-11],且目前使用GRI算法研究肺炎患儿临床特征与病原的关联的文献较少。本研究采用GRI算法研究肺炎患儿临床特征与不同病原的关联,为儿童肺炎不同病原的临床特征研究提供新的思路。
1 资料与方法
1.1 资料来源 选取2005—2009年广州市儿童医院住院的肺炎患儿6 290例为研究对象;年龄1 d~14岁;住院时间2~44 d。
1.2 诊断标准 肺炎诊断标准参考第7版《儿科学》[12],患儿均有咳嗽等临床症状,肺部检查有实变体征和 (或)湿啰音,胸部X线检查显示片状、斑片状浸润性阴影或间质性改变,并排除肺结核、肺部肿瘤、肺脓肿、肺血管栓塞、肺出血等。
1.3 方法
1.3.1 建立病例数据库 用Excel建立6 290份原始病例资料数据库,保留性别、年龄、年度等临床特征资料和肺炎病原数据。
1.3.2 GRI算法 根据建立的病例数据库文件,利用GRI算法进行临床特征资料和病原数据的相关性分析。GRI算法的基本思路[7]是依据深度优先搜索策略进行分析。它从后项入手,逐个分析后项,分析完一个后项再分析一个后项;在分析每个后项的过程中,逐个分析后项所包含的具体类别,分析完一个类别后再分析一个类别;在分析每个类别的过程中,逐个分析前项,分析完一个前项后再分析一个前项;在分析每个前项的过程中,逐个分析前项所包含的具体类别,分析完一个类别后再分析一个类别。支持度 (support,%)代表给定数据集在所有的数据集中出现的频率;置信度 (confidence ......
您现在查看是摘要页,全文长 8301 字符。