以《医方类聚·消渴门》为例探讨知识元标引在方证和药证规律研究中的应用
方剂,1研究资料,2方法,1知识元标引规范化处理,2构建知识元标引数据库,3构建逻辑数据与知识图谱,3结果,1标引逻辑数据统计,2方证知识图谱,3核心药证知识图谱,4讨论,1方-证规律分析
赵倪娟,戴娜,罗涛,王帅虎,谭辉,谢宇,张丽莎,郭锦晨,陆翔(1.安徽中医药大学中医学院,安徽 合肥 230012;2.北京邮电大学信息与通信工程学院,北京 100876)
知识元是指语义上相对完整地表达特定知识的最小的内容单元,是能够被标记、存储、使用和管理的最小知识个体。知识元的研究多应用于图书情报以及计算机领域,现在随着网络信息技术的发展,亦逐渐向多领域扩展。在中医学领域,主要应用于中医古籍数字化的研究。
《医方类聚》系朝鲜金礼蒙等人所编的中医类综合性方书。该书成书于公元1445年,仿王焘《外台秘要》类书体例,选录明朝中期之前医籍及一些道教、佛教典籍中涉及医药方面的文献,共150余种。按照病证分列92门,共计266卷(现存世262卷),收录方剂5万余首。《医方类聚·消渴门》中引录的中国医籍尤为丰富,涉及历代方书47种,堪称集历代医方之大成。该门所录的医籍有些已经亡佚,因此该书具有重要的文献研究价值,除了能为研究明代中期之前中医药治疗消渴的理论与经验提供研究资料外,还能为现代中医诊疗消渴提供参考。
本文选取《医方类聚·消渴门》中的方药内容,依据知识元标引理论,通过对选取的文献进行数字化解析与标引加工,形成知识体和知识元间的层级知识图谱,通过挖掘《医方类聚·消渴门》中的方证和药证规律,探寻知识元标引在中医古籍数字化中的应用思路和方法。
1 研究资料
本研究所选用的《医方类聚》为人民卫生出版社1982年校点本。将《医方类聚·消渴门》的文献进行文本规范化处理,上传已校勘的电子文本至中医古籍“病脉证并治”知识元标引系统(以下简称“标引系统”),并按照纸质版篇章进行书体结构目录划分。“标引系统”是国家重点研发计划“中医药现代化研究”项目“基于知识元理论与临床需求深度融合的中医古籍整理及专题文献研究”在知识元理论的基础上建立的中医古籍加工平台。该系统的标引方法融合了框架表示与语义网表示两种知识表示方法,即基于现有研究基础或学界普遍认可的理论范式,预定义模板,确定标引主体,再将研究对象所涉及的语料知识元填充到预定义模板中,形成基于某一理论范式的语义网络,以此提高传统中医古籍的整理效率。
2 方法
2.1 知识元标引规范化处理
“标引系统”包括书体结构、标引模板、知识体、知识元、语义成分、语义类型、语义关联类型、知识体关联类型等。标引员登录“标引系统”后,通过“病脉证并治”标引模板进行线上自由标引。逻辑数据的构建主要依托于“标引系统”的数据导出功能,通过将《医方类聚·消渴门》的方药数据导出并存储在MSSQLServer数据库中,再按照预先设定好的数据导出程序,将全部标引的逻辑数据语言读取保存并规范化处理 ......
您现在查看是摘要页,全文长 13773 字符。