首页 中国小康网 小康论坛 卡乐图片网 小康视频 小康直播 加入收藏 设为首页
  2018年07月《小康》下旬刊
  栏目:封面故事
互联网+健康医疗:用大数据解码人类“生死簿”

★文 /尤蕾

  大数据在未来不仅能够将医生从繁重的工作中解放出来,让他们减轻重复性劳动而专攻疑难杂症突破医学难题,还能够在检测药品不良反应方面展露锋芒。上市后,药品不良反应监测分为主动监测和被动检测。被动检测依赖于医生、患者、制药公司提供的不良反应报告,而主动监测则侧重医疗数据的挖掘技术,利用文本挖掘、数据挖掘技术从EHR、EMR、社交网络、搜索引擎中发现潜在药品导致不良反应事件。据刘健介绍,当药物使用与不良反应存在低频率的因果关系时,一般的数据挖掘算法将难以分辨因果关系和偶然事件,基于预认知决策模型(RPD model)设计了多种算法用以发现药品不良反应中的低频因果关系。

  此外,卫生部门还将依托于大数据,完善传染病、疫情等预警机制,创新慢性病管理模式,促进慢病诊治更科学化、精准化。

  寻找分享性与安全性的平衡点

  与其他大数据显著不同的是,健康医疗大数据采自每一个人,涉及到了人们最隐私的部分。在健康医疗大数据蓬勃发展的同时,安全性问题显得尤为重要,在个人隐私面前,还是要“踩刹车”,谨慎慢行。

  美国在2016年—2017年间曾经发生数起健康医疗数据泄漏事件。暗网黑客组织TDO三次非法入侵并公布了18万份患者病历;在暗网上有超过50万份儿童病历可供下载,病历中包含了儿童及其父母的姓名、社会保险号、电话和住址;超过91.8万份老年人个人健康数据被泄露;Denton心脏医疗集团备份了7年电子病历数据的未加密硬盘被盗,包括从2009年到2016年间患者姓名、出生日期、住址、电话、驾照号码、医生姓名、保险、诊所账号、病历信息、检验结果以及用药信息等数据……

  在大数据时代,如何保护信息安全与个人隐私?

  “数据的安全性,永远不是一个点的问题。”刘健介绍道,保护隐私,从数据采集时就应该考虑这个问题,可以说这是一个系统工程。就南京中心而言,随着大数据的建立,安全防护工作就在同步进行。目前南京中心已经建成四级保护等级,是江苏省第二个认证的四级保护,第一个是国家电网调度中心。杰若创首席执行官管晓寅补充道,从数据使用的角度看,在科研或产业应用上,可能并不需要知道个人的信息,而是寻求更高层面上的规律,“通过我们这个平台对数据进行管理,比如对外提供一些接口或算法,保证产业化用户只获取他们需要的规律,而非个人信息”。

  诚如刘健所言,分享性与安全性本身就是一对矛盾。在解决安全性问题上,南京中心采取了数据分级保护,这就意味着,原始数据肯定不会被拿出去用,而是进行数据“脱敏”。这与国家卫健委的要求高度一致,金小桃也特别强调,做好个人隐私数据的 “脱敏”、“去标识化”,才能就某一种疾病进行大数据的挖掘分析,在应用和研究时只能看到群体差异化特征,阻止对个体化信息的开发使用。另外,南京中心还追求“最小化”原则,通俗解释即能不给出去的就不给出去,可以在这个平台上进行分析,客户获得的是分析结果,而原始数据始终留在中心。

  在企业探索数据安全的模式的同时,大数据安全也引起了国家卫健委的高度重视。在《人口健康信息管理办法(试行)》的基础上,依据《中华人民共和国网络安全法》,国家卫健委正编制《健康医疗大数据安全管理办法》。一方面要推进网络可信体系建设,包括强化健康医疗数字身份管理,建设全国统一标识的医疗卫生人员和医疗卫生机构可信医学数字身份、电子实名认证等。另一方面是加强健康医疗数据安全保障,开展大数据平台及服务商的可靠性、可控性和安全性评测,以及应用的安全性评测和风险评估。

  值得注意的另一个问题则是,数据采集范围广、维度高、类型种类繁多、持续、快速增长的海量数据、不同格式数据、丰富多元化的语义数据等医疗大数据特性,都对于数据的统一存储、管理、分析应用上存在众多需要挑战突破的方向。

  在刘健看来,目前大数据收集也因种种现实因素遭到掣肘。在一些小医院,数据就存在医生的电脑中,当数据满了就会被删掉。相对而言,大医院有自己的终端,数据都得到了较为完整的存储,但是医院信息化系统过多,相互之间难以打通,这就导致数据无法得到有效整合。“我们的目标之一就是把分散在不同系统里的零散信息收集起来,一种方式是直连医院,另一种是把医院现有的存量数据直接传输至中心,未来的增量想数据逐渐传到中心。”刘健说。

 
编辑:容与
来源:小康杂志
发布时间:2019-08-01


2018年01月(《小康》下旬刊)


2018年02月(《小康》下旬刊)


2018年03月(《小康》下旬刊)


2018年04月(《小康》下旬刊)