当前位置: 首页 > 期刊 > 《医学信息》 > 20206
编号:13507461
基于社区居民健康大数据预测高血压的患病风险(2)
http://www.100md.com 2020年2月12日 《医学信息》 20206
     Key words:Hypertension;Machine learning;Community health records;Gini coefficient decline method

    根据中国高血压防治指南[1](简称指南),我国高血压患病率呈不断升高的趋势,特别是血压值处于130~139/80~89 mmHg的人群极易进展为高血压。高血压主要分为没有明确发病原因的继发性高血压和原发性高血压,其中后者占发病人群的95%[1]。流行病学研究认为[2],我国的高血压发病主要受高钠低钾饮食、超重与肥胖、过度饮酒和长期精神紧张有关,且在更年期前男性发病率高于女性,更年期后女性发病率高于男性。本文利用健康大数据对以上问题进行分析,采用机器学习算法建立高血压患病风险模型,为医生诊断和居民保健提供参考依据,并进一步通过特征的重要性分析高血压的重要影响因素,现报道如下。

    1材料与方法

    1.1数据预处理 通过石景山区卫生信息平台选取2018年1月~12月约20万份北京市石景山区居民健康档案,提取居民的年龄、性别、身高、体重、血型、患病情况、文化程度、职业、婚姻状况、药物过敏、暴露史、亲属病史、残疾情况、是否吸烟、是否饮酒、是否锻炼、睡眠状况、饮食习惯等方面的101个特征变量进行描述。所有特征只保留一个重复变量,排除意义不明变量、出现频率小于5%的变量。最终保留了20个特征变量:年龄、性别、糖尿病、冠心病、其他慢病、受教育水平(按照受学历教育的年限划分)、职业类型(分为国家机关、党群组织、企业、事业单位负责人 ......
上一页1 2

您现在查看是摘要页,全文长 6110 字符