2014年04月中旬,美国医学信息学会发起了由Informatics for Intergrating Biology & the Bedside和UTHealth承办的关于“面向临床医疗文本的去隐私化和随时间变迁的心脏病风险因子识别”的国际评测,此次评测历时两个半月,吸引了来自全球6个国家和地区20个科研院所和企业的研究团队参加。哈尔滨工业大学深圳研究生院智能计算研究中心王晓龙教授、陈清财教授和汤步洲博士后率博士生刘增健和李昊迪组成的团队参加了此次评测,在“去隐私化”和“随时间变迁的心脏病风险因子识别”两个任务上获得了国际第二、国内第一的好成绩。
随着医疗信息化的发展,可用的医疗信息越来越多,以文本记录为主的临床医疗文档在国际上获得了广泛关注。去除包括病人、医生、医院等在内的隐私信息(即,去隐私化)是使用临床医疗文本信息必须解决的首要问题。心脏病是人类第一杀手,导致心脏病的因素很多,包括家族病史、并发疾病、个人健康指标和服用药物等。抽取临床医疗文本中“随时间变迁的心脏病风险因子”是分析心脏病成因并进行辅助预防和诊疗的关键技术之一。中心研究团队受邀参加今年11月14日在美国华盛顿特区举行的i2b2 NLP challenge研讨会就实现的“去隐私化”系统做海报讲解,“随时间变迁的心脏病风险因子识别”系统做口头报告。在参赛过程中,中心合作方中山大学孙逸仙纪念医院王景峰教授团队和深圳市第六人民医院邓启文主任医师团队给予了极大地支持和帮助,在此表示衷心感谢。