基于社区居民健康大数据预测高血压的患病风险

基于社区居民健康大数据预测高血压的患病风险(2)

http://www.100md.com 2020年2月12日《医学信息》 20206

     Key words：Hypertension;Machine learning;Community health records;Gini coefficient decline method

    根据中国高血压防治指南[1](简称指南)，我国高血压患病率呈不断升高的趋势，特别是血压值处于130～139/80～89 mmHg的人群极易进展为高血压。高血压主要分为没有明确发病原因的继发性高血压和原发性高血压，其中后者占发病人群的95%[1]。流行病学研究认为[2]，我国的高血压发病主要受高钠低钾饮食、超重与肥胖、过度饮酒和长期精神紧张有关，且在更年期前男性发病率高于女性，更年期后女性发病率高于男性。本文利用健康大数据对以上问题进行分析，采用机器学习算法建立高血压患病风险模型，为医生诊断和居民保健提供参考依据，并进一步通过特征的重要性分析高血压的重要影响因素，现报道如下。

    1材料与方法

    1.1数据预处理通过石景山区卫生信息平台选取2018年1月～12月约20万份北京市石景山区居民健康档案，提取居民的年龄、性别、身高、体重、血型、患病情况、文化程度、职业、婚姻状况、药物过敏、暴露史、亲属病史、残疾情况、是否吸烟、是否饮酒、是否锻炼、睡眠状况、饮食习惯等方面的101个特征变量进行描述。所有特征只保留一个重复变量，排除意义不明变量、出现频率小于5%的变量。最终保留了20个特征变量：年龄、性别、糖尿病、冠心病、其他慢病、受教育水平(按照受学历教育的年限划分)、职业类型(分为国家机关、党群组织、企业、事业单位负责人 ......

上一页第 1 2 页

百拇医药网 http://www.100md.com/html/paper/1006-1959B/2020/06/01-1.htm

您现在查看是摘要页，全文长 6110 字符。