问医生 找医院 查疾病 症状自查 药品通 健康笔记

大数据:分析医疗数据还用抽样数据?out了!

2014-11-24 21:56:2239健康网
栏目关注:
核心提示:国家卫生计生委医院管理研究所医院评价中心研究员王吉善指出,同一种疾病,不同的数据和统计方法,得出的结果也有差异,在大数据时代,分析医疗数据要分析与事物相关的所有数据,而不是依靠分析少量的样本数据。

  “大数据”,是21世纪备受大家关注的信息化热词,大数据浪潮如同潮水般扑面而来,到底大数据能做什么?现代数据统计又应该有哪些转变?国家卫生计生委医院管理研究所医院评价中心研究员王吉善在第八届中国医院院长年会上同一个疾病多组不同数据的差异来说明。

王吉善

  医疗数据分析还用抽样?你out了!

  今年8月,某媒体头版刊登的文章《急性心梗治疗效果10年无改善》引起王吉善的注意。急性心梗所在的心内科,是内科系统最活跃的学科,近些年来学习了许多国外的先进方法和治疗手段,这些年来的努力怎么会没有改善?于是,王吉善从文章选取的数据样本进行了研究分析。

  文章抽取的样本是162家医院2001年、2006年和2011年因急性心梗住院的18631份病例,这些数据经分析后发现,我国急性心梗住院患者人数增加4倍,但住院病死率及主要并发症发生率等并无明显下降。

  王吉善查询了两组对比数据:

  1.20家医院2010年-2012年26080例急性心梗患者,出院人次逐年增加(7133人次增加至10365人次),且住院死亡率逐年下降(5.30%降至3.86%)。

  2.40家医院2010年-2012年急性心梗54271例,死亡率呈逐年下降趋势,从6.46%降至5.33%。2011年和2012年的死亡率略低于美国公布的急性心梗死亡率6.1%-5.4%的水平(2013年)。

  这两组数据不是随机抽样,而是经过专业人员梳理后的整体样本,属于大数据样本。王吉善认为,医疗是进步的,近年来我国在急性心梗救治方面出台了一系列有效措施,都对这个疾病的的成功救治起了促进作用,抽样的数据并没体现真实的情况。

    数据仓库研究院马克·马德森研究员曾指出, 在大数据分析时代,如果继续采用数据抽样的方法,你实际上可以处理所有数据,但数据的科学性本质上是削弱的。

  大数据时代来临

  数据统计要有三个重大思维转变

  王吉善认为,应对大数据“浪潮”,对于数据统计,思维上要迎合时代变化有所转变。

  1.分析与事物相关的所有数据,而不是依靠分析少量的样本数据。比如谷歌流感趋势预测并不是依赖于随机抽样分析,而是分析了整个美国几十亿条互联网检索记录而得到的结论。分析整个数据库,能够提高微观层面分析的准确性,甚至能够推测出任何特定尺度的数据特征。

  2.接受数据的纷繁复杂性,而不再追求精确性。在信息时代,我们掌握的数据越来越全面,人们不再过分担心某个数据点对整套分析的不利影响。大数据要求人们能够接受数据的混乱和允许数据的不精确。随着数据规模的扩大,人们对数据精确度的痴迷将逐步减弱。

  3.不再探求难以捉摸的因果关系,转而关注事物的相关关系。小数据时代,人们往往想知道数据背后的原因。在大数据时代,数据相关关系分析可以为人们提供一系列新的视野和有用的预测,找出新种类数据间的相互联系。

  王吉善指出,未来社会的竞争不是劳动生产率的竞争,而是知识生产率的竞争,数据是知识的源泉,能够创造极大的价值,医院数据信息库的建设与完善是很重要的。

39健康网(www.39.net)专稿,未经书面授权请勿转载。

39健康网专业医疗保健信息平台 优质健康资讯门户网站  

中国领先的健康门户网站,中国互联网百强,于2000年3月9日开通,中国历史悠久、规模最大、拥有丰富内容与庞大用户的健康平台。多年来,在健康资讯、名医问答、就医用药信息查询等方面持续领先,引领在线健康信息,月度覆盖超4亿用户。

特别策划
热门问答更多
推荐医院更多
举报/反馈
链接地址:*
举报内容问题:*请选择举报类型
原创文章链接:
其他理由:
更多问题及建议:
联系方式: