当前位置: 首页 > 期刊 > 《医学信息》 > 202022
编号:13838158
医学生物学案例库构建及作用(2)
http://www.100md.com 2020年6月4日 《医学信息》 202022
     2.1重症医学医疗数据库 目前重症监护数据库中最主要的数据库为:MIMIC-Ⅲ数据库。据Johnson AE等报道[5],MIMIC-Ⅲ是一个大型的单中心数据库,该数据库收集了大型三级医院重症监护病房收治患者有关的信息。所搜集的数据包括生命体征、医护人员记录的病历、实验室检验结果、影像报告、诊断代码、住院时间、生存数据等。该数据库可应用于多种方面,包括学术和工业研究、高等教育课程等。在数据被纳入MIMIC-Ⅲ数据库之前,首先根据《健康保险可移植性与责任法案》(HIPAA)标准,先使用结构化数据清理及日期转移两大手段对数据进行识别[5]。结构化数据的去识别化过程需要删除HIPAA中列出的所有十八个标识数据元素,包括诸如患者姓名、电话号码、地址、日期之类的字段。特别是,为了保持时间间隔,每个患者以相同的方式通过随机偏移将日期移到未来,从而使其在2100到2200年之间的某个时间发生停留。一天中的某个时刻、一周中的某天以及大致季节等,在日期转换期间被保留了下来。比如89岁以上患者的出生日期被更改,以掩盖其真实年龄来符合HIPAA规则:这些患者出现在数据库中其年龄可能超过300岁。通过使用经过严格评估的去识别化系统(该系统基于广泛的字典查找和带有表达式的模式匹配) ......
上一页1 2 3 4 5下一页

您现在查看是摘要页,全文长 4667 字符