中华医学图书情报杂志2015年1O月第24卷第lO期 DOI:10.3969/j.issn.1671-3982.2015.10.004 Chin J Med Libr Inf Sci,Vo1.24 No.10 October,2015 ·13· 研究生论坛· 主要发达国家医疗健康大数据分析 朱彦。徐俊,朱玲,崔蒙 [摘要]通过对几个主要发达国家医疗健康大数据的调研,从战略规划、基础设施建设、关键技术研发、人才培养、隐私保 护等方面比较分析了美国、英国、法国、日本、韩国、新加坡的医疗健康大数据及其共性特点、各自特色,最后从进一 步完善我国医疗健康大数据配套方面提出了转换思维、建立运行机制、构建建设标准、搭建共享平台和重视人才培养五 点建议。 [关键词]医疗健康;大数据;战略规划;国家 [中图分类号]R199;TP311.13 [文献标志码]A [文章编号]1671—3982(2015)10—0013—05 Policies of healthcare big data in major developed countries ZHU Yan,XU Jun,ZHU Ling,CUI Meng (Traditional Chinese Medicine Information Institute,Chinese Academy of Traditional Chinese Medicine,Beijing 100700,China) Corresponding author:CUI Meng [Abstract]The policies of healthcare big data and their common and respective characteristics in USA,Britain, France,Japan,Republic of Korea,and Singapore were analyzed in aspects of their strategic planning,infrastruc· ture construction,R&D of key technologies,professional training,and privacy protection with 5 suggestions put for— ward for improving the policies of healthcare big data in China,namely transforming thinking,establishing opera- tional systems,working out construction criteria,building platform or fbig data sharing,and attaching importance to professional training. [Key words]Heahhcare;Big data;Strategic planning;National policy 随着强大的数据存储、互联网、可穿戴设备等新 技术的发展,数据收集变得越来越容易,健康医疗数 据出现大爆发的趋势。有报告显示,2011年美国的 35zatabytes,相当于2009年的44倍。 有效整合和利用的医疗大数据对个体医生、康 保中心、大型医院、责任医疗组织(accountable care organization,ACO)和研究机构都有着显著作用。麦 医疗健康系统数据量达到了150EB,以目前的增速 很快会达到ZB(约10 GB)和YB(约10”GB)的级 肯锡估计,单就美国而言,医疗大数据的利用每年可 以节省3 000亿到4 500亿美元医疗开支l2 J。而我 别…。据统计,到2020年,医疗数据将急剧增长到 【基金项目】中国中医科学院中医药信息研究所第八批基本科研业 国目前每年医疗费用总额超过2.4万亿元,如果按 照这个比率,我国每年将节省医疗费用近2 000亿 元。据CDW公司的最新调查报告,那些在数据分 析上较为积极的医疗机构已经采取了有力的措施 务费自主选题项目“本体驱动的中医古籍疾病知识抽取 模型研究”(zz080319) [作者单位】中国中医科学院中医药信息研究所,北京[作者简介]朱100700 彦(1983一),湖南长沙人,在读博士,研究方向为中 (比如加大投人改善数据采集的方法、增加数据存 医药数据挖掘、自然语言处理等。 储的容量、研究和使用新的数据分析方法等),部分 机构已经制定了针对这些领域的详细投资计划,许 多机构已经享受到了数据分析在临床治疗(如提升 [通讯作者】崔蒙(1953一),男,山东烟台人,硕士,研究员,博士生 导师,研究方向为中医药信息学、医学情报学等。E— mail!cui@mail.cintcm.ac.cn 14· 中华医学图书情报杂志2015年10月第24卷第10期 Chin J Med Libr Inf Sci,Vo1.24 No.10 October,2015 患者疗效)和行政管理(如改善财务报告)方面的好 处,65%的机构表示2015年会继续增加在数据分析 为了促进信息的交换和用户使用,美国医疗保 险和医疗补助服务中心(Centers for Medicare and 方面的投入,每家机构平均在数据分析上的花费在 2015年预计将达到190万美元_3j。 1 主要发达国家分析 Medicaid Services,CMS)创立了信息产品和数据分 析办公室(Office of Information Products and Data Ana- l ̄ics),监督和协助各部门数据的上传和发布。 2015年1月底,美国总统奥巴马在2015年国情咨 发达国家已将医疗健康数据作为国家公共事业 的重要组成部分,投入了大量的资金,对健康数据的 文演讲中宣布了生命科学领域新项目一精准医疗计 利用成为衡量国家经济发展的新指标H J。 1.1 美国 美国将大数据视为强化美国竞争力的关键 因素之一,把大数据研究和生产计划提高到国家战 略层面。2012年3月,美国奥巴马宣布投资2 亿美元启动“大数据研究和发展计划”,这是继1993 年美国宣布“信息高速公路”计划后的又一次重大 科技发展部署。与此同时,美国联邦通过各种 和倡议鼓励健康医疗数据的使用,对医疗费用 和质量乃至整个健康医疗生态系统起到了直接的改 善作用 J。 1.1.1立法和资金资助 健康医疗的相关立法使公共数据(包括病人信 息、临床试验、健康保险和医学最新进展数据)更易 获得。早在1996年,著名的健康保险携带和责任法 案(Health Insurance Portability and Accountability Act,HIPAA)在克林顿通过,其中规定了医疗信 息的标准和格式,以降低医疗行政流程成本。 而最近发布的联邦级别的法律有:2009 Open Govemment Directive及美国卫生和人类服务部 (HHS)基于健康数据计划(Health Data Initiative, HDI)下的一系列后续措施,开始整合不同机构的数 据;合理医疗费用法案(Affordable Care Act,ACA)于 2010年3月生效,授权HHS来发布数据以提高健 康医疗和保险市场的透明度;促进经济和临床保健 的卫生信息技术法案(Health Information Technology for Economic and Clinical Health,HITECH)Act,作为 2009年美国复苏与再投资法案(American Recovery and Reinvestment Act)的一部分,批准了400亿美元 刺激资金补贴服务提供者,以鼓励其使用EMRs,其 最终目标是2019年将使用率从目前的70%提高到 90%。HITECH法案还批准了20亿美元支持EMR 相关人员培训及基础设施建设。 划(Precision Medicine Initiative),该计划致力于治愈 癌症和糖尿病等疾病,让所有人获得健康个性化信 息。美国将从2016年财政预算中为精准医疗项目 划拨2.15亿美元经费,除了支持新一代的科学家开 发创造性的新方法外,还将推出100万以上的美国 全国队列研究,志愿者将分享他们的基因信息和生 物标本、电子医疗数据(如化验结果)和MRI扫描、 生活数据(如热量的消耗和环境的风险),通过移动 医疗设备进行追踪;参与者将有权控制信息的共享 程度,在获得健康数据的同时形成大数据信息 ]。 1.1.2开放数据和标准化体系 随着发布的数据越来越多,联邦也一直努 力保障所有相关的利益方能获得标准格式的数据。 如科技办公室(Ofifce of Science and Technology Policy)于2012年发布的大数据研究和发展倡议 (Big Data Research&Development Initiative),就拨 付2000万美元以支持不同部门发布数据集,并提高 其可使用性;健康数据计划(Health Data Initiative, HDI)则通过HealthData.gov网站发布各种标准化 格式的数据(包括各种联邦数据库,并附有临床服 务提供者的质量信息、最新的医学和科学知识、消费 产品数据和社区医疗运营情况、预算等),另外 还针对开发者提供了编程访问接口,以确保数据能 被机器可读及应用程序可下载和访问;最新的精准 医疗项目将向健康信息技术国家协调办公室 (ONC)资助500万美元用于制定一系列的标准和 要求,以保护隐私和跨系统数据交换安全。 I.2英国 大数据已经成为英国目前大力发展的战略 领域之一。英国经济与商业研究中心(CEBR)2012 年研究报告进一步证实了大数据的经济价值,2011 年英国私企和公共部门企业的数据资产价值为251 亿英镑,2017年预计将达到407亿英镑。 中华医学图书情报杂志2015年l0月第24卷第lO期 Chin J Med Libr Inf Sci,Vo1.24 No.10 October.2015 ·15· 2012年,英国皇家学会发布了《作为开放事业 的科学》(Science as an Open Enterprise)报告,对英 数据大会”,会上法国经济、财政和工业部门宣布将 投人1 150万欧元用于支持公开教育、健康等7个 重点项目。这些项目的目的在于“通过发展创新性 国和社会在大数据时代中的发展战略进行了展 望,同时对和相关机构提出了相应建议。同年 7月,英国商业创新技能部(Department for Business, Innovation&Skills,BIS)成立数据战略委员会(Data 解决方案,并将其用于实践,来促进法国在大数据领 域的发展。”此前,法国软件编辑联盟(AFDEL)曾号 召部门和私人企业共同合作,投入3亿欧元用 于推动大数据领域的发展。AFDEL认为,未来5年 Strategy Board,DSB),2013年伊始,英国又提出 对大数据领域研究给予1.89亿英镑的资助L6 J。主 内大数据创造的价值将会达到28亿欧元,同时将会 要措施包括以下几方面。 1.2.1加大投资技术研发 英国在数学和计算机算法领域拥有较强的实 力,凭借强大的算法实力,英国为大数据战略构建强 大的软件系统平台已经具有技术方面的优势。 1.2.2建设强大的基础数据库 英国国民医疗服务系统(National Health Service, NHS)是英国引以为豪的完备体系。该系统有 着庞大而完备的英国医疗数据,包括病人的健康记 录、疾病数据等,而且英国还有长达210年的全国 普查的健康记录。在遵循严格保密准则和有效的法 律保障下,这些数据可以用来为公共卫生服务、医学 研究等创造更多的价值。目前,英国数据战略委员 会已开始整理NHS的数据,并分类开放。这些数据 对医学研究、医药制造以及全英乃至全球的医疗健 康服务体系都有着极其重要的价值。 1.2.3重视数据的开放性 英国要求各公共部门在其互联网(http:// data.gov.uk)向全社会开放管理、机构运营以 及各项统计数据等相关信息。2012年5月,建立了 世界上首个非营利性的开放式数据研究所(The Open Data Institute,ODI),它利用互联网技术将全世 界提供的数据汇总到一个平台上,利用云存储等新 兴技术手段达到海量存储_7]。同年6月,英国 发布《开放数据》(Open Data White Paper), 建立了一套对公共部门数据开放程度的评价体系, 审计各公共部门完成开放数据任务情况,旨在促进 英国公共服务数据的开放,建设一个开放型的。 1.3 法国 法国在《数字化路线图》中列出了5项将 会大力支持的战略性高新技术,而“大数据”是其重 要内容。2013年4月法国召开“第二届巴黎大 产生1万个工作岗位。 1.4 日本 为提高通信领域的国际竞争力、培育新产业,日 本总务省于2012年7月发布“活跃ICT日本”新综 合战略,其中最受关注的是其大数据。2013年 6月,安倍内阁正式公布了新IT战略一“创建最尖 端IT国家宣言”。该宣言全面阐述了2013—2020年 期间以发展开放公共数据和大数据为核心的Et本新 IT国家战略,提出要把日本建设成为一个具有“世 界最高水准的广泛运用信息产业技术的社会”。 2014年6月对该宣言进行了更新_8 J,鼓励各方在医 疗健康大数据平台下,灵活利用医疗数据,改进健康 管理和疾病预防,建立健康长寿型社会。 是建立高效优质的医疗、远程医疗、住宅医疗 以及生活志愿服务等在内的多种主题共同联合结 构,以提供更有效率的医疗服务;二是建立医疗信息 联合网络,鼓励信息的共享,医院和保险公司等机构 都要提供医疗和健康信息的各种数据,以便于分析 和再利用,2018年将基本完成全国范围内的大数据 分析降低医疗费用的工作;三是推进医疗健康信息 等各种数据的灵活使用,预防生活习惯不良诱发的 疾病和重病,增进健康;四是建立强有力, 2016年之前,为地区和企业中的国民健康增进健康 管理建立有效的对策,以此为基础推向全国,为此首 次设立了相当于副首相级的首席信息技术长官 (CIO)职位,以监督日本信息技术战略的PDCA循 环(又叫戴明环,美国质量管理专家戴明博士提出 的全面质量管理所应遵循的科学程序)。 1.5韩国 韩国也已将大数据纳入国家战略。2013年,韩 国科学资讯通信技术和未来规划部(111e Ministry of Science,ICT and Future Planning)与国家信息社会 16· 中华医学图书情报杂志2015年l0月第24卷第10期 Chin J Med Libr Inf Sci,Vo1.24 No.10 October,2015 机构(the National Information Society Agency)合作, 建立了韩国大数据中心,目的是促进的数据分 析。2014年7月,韩国宣布了一项新的战略一 低的。为了保持这种高效率并应对人口老龄化的趋 势,于2012年推出“新加坡健康医疗2020总体 规划”,其中对数字医疗技术寄予厚望H。。。 1.6.1大数据基础设施 未来增长引擎执行计划,将大数据作为13个未来增 长引擎的领域之一。2014年l2月底发表“国家优 先开放资料的开放计划”,2015—2017年公开4O个 行业领域的数据供民众使用。据报告预测,韩国健 康医疗数据(2013年至2020年)年均增长25%以 新加坡是世界十大高速网络架构之一,它承载 了东南亚地区半数以上的第三方数据中心储存量。 新加坡已确立其作为全球数据管理枢纽的地位,这 为医疗健康大数据提供了坚实的基础条件。作为新 加坡医疗保健IT总体规划的一个关键的全国电子 上,将高于全球市场的平均水平。 2015年4月8日,在2015 Bio&Medical Korea 健康记录(NEHR)项目于2011推出,该系统统一存 储了每位病人的医疗记录,目前有超过280个机构 的14 000以上的医生正在使用。未来1O年,将需 要5 000万美金用于构建健康云(hCloud),其中一 半费用由作为基础设施建设进行投人。 1.6.2培养大数据人才 会上,保健福祉部宣布了“健康医疗行业提升 计划(Helathcare Industry Promotion Plan)”,健康行 业已经上升到韩国的国家战略层面。该计划将 强化已有健康行业的基础设施,并打造一个链接不 同医学基础设施的平台,包括以下内容 J。 生物医学银行(Bio—bank):韩国计划到 2017年,将支持基于生物医学银行数据的项目从 2013年的1 000个左右增加到2017年的2 000个以 与企业及本地高等院校开展合作,确保毕业生 获得必备的专业知识和技能。目前,新加坡在数据 分析领域开设了4门硕士课程和5门本科课程,提 供侧重于具体行业应用的多学科研究方法。 1.6.3加强大数据立法 上。最终,将能收集标准化的临床数据和分析 整合的组学数据(Omics data)。 健康医疗大数据:韩国计划将于2017年构 2012年公布了《个人资料保》(PDPA),旨 在防范对国内数据及源于境外的个人资料的滥用行 为。该法案的出台使公民得以进一步了解个人资料 建一个开放平台,不仅能连接国家健康保险服务系 统、健康保险审核评估系统、国家疾控中心和国家癌 症中心等各种信息系统,还包括一套法律法规框架 来保护个人隐私信息。 1.6新加坡 的使用途径,同时在进行个人信息处理的过程中,也 加强了企业与客户之间的信任程度。 2主要发达国家比较 新加坡拥有全球医疗保障体系,其健康排名世 在健康医疗大数据产业的支持方面,各国的政 策和计划均有侧重点,详见表1。 界第6,但人均医疗保障支出在高收入国家中是最 表1各国比较 注释:◇未明确;圈有但较模糊;◆明确 从纵向的要点来看,各国在以下方面基本 业的推广应用,确保领先地位;重视健康医疗大数 达成共识:战略目标基本相同,旨在通过国家性战略 据,期望能降低医疗成本,提升产出价值;注重基础 规划推动本国大数据技术研发、产业发展和相关行 设施建设,通过打造大型、开放的平台实现数据共 中华医学图书情报杂志2015年1O月第24卷第1O期 Chin J Med Libr Inf Sci,Vo1.24 No.10 October,2015 ·17· 享;鼓励各方积极参与,并研发相关标准来加强数据 “有保护性的共享”,而不是“单纯保护”思维。未 的互操作性;注重交叉学科专业人才培养;通过立法 来,数据共享将是常态。 来保护个人隐私。 3对现阶段国内健康大数据发展的启示 3.2.2建立一套运行机制 健康医疗大数据建设是一项有序的、动态的、可 持续发展的系统工程,因此,必须建立良好的运行机 3.1 我国医疗健康大数据与规划情况 据估计,2020年我国健康产业市场规模将发展 制,以促进建设过程中各个环节的正规有序,实现统 到8万亿人民币。目前,医院病人治疗费用占整个 合,搞好顶层设计。健康医疗是关乎国家竞争力和 健康产业的75%;而到2020年,医院治疗费用预计 全民生活福祉的重要领域,需要强有力的资金保障。 将降到35%的水平,其他的65%会在医院之外产 国外大数据都有明确、具体的资金保障。 生,这对我们整个社会经济科学发展是巨大的、潜在 的市场和推动力。 我国自2008年4月启动区域卫生信息平台建 设方案研制工作。《健康中国2020战略研究报告》 中提出未来要推进七大医疗体系专项建设,在医疗 信息化方面卫生部将推出611亿元预算的全民电子 健康系统工程。2012年我国批复了“十二五国 家政务信息化建设工程规划”,其中医疗卫生是重点 支持的工程。从2013年开始,在医改办对建 设医疗信息化的规划下,在卫计委大力推进分级诊 疗和远程诊疗的进程中,打通医疗大数据已具备政 策支持的基础。 2014中国健康大会上,国家卫生计生委规划信 息司副张峰发言称,医疗卫生信息化是国家信 息化发展的重点,已纳入“十三五”国家网络安全和 信息化建设重点,将实现重点突破。我国科技部举 办了首届“国家精准医疗战略专家会议”,成立了1 个19人的专家委员会,并计划在2030年前投入600 亿元,酝酿精准医疗计划。国家卫计委也于近期公 布了首批肿瘤基因测序临床应用试点单位名单… 。 3.2策略和建议 健康医疗大数据背后蕴藏的巨大价值已被广泛 认可,各国正谋划符合自身特点的健康医疗大数据 。我国健康医疗大数据市场刚刚起步,配套规 划与还存在较多缺口,一方面需要加快研究健 康大数据发展战略,另一方面可以借鉴国外大数据 。具体的策略和建议包括以下几个方面。 3.2.1转换一种新的思维 对于管理者和数据提供者来说,大数据时 代对管理与服务提供了更多支撑,也提出了更 高的要求,应该将病人数据的“收集”思维转换到 3.2.3规范一套建设标准 数据采集及标准化是大数据医疗背后的基石, 没有标准就没有统一的平台系统。应该建立面向不 同主题、覆盖各个领域、不断动态更新的大数据建设 标准,实现各级各类健康医疗信息系统的网络互连、 信息互通、资源共享奠定基础。如数据处理的标准, 能够帮助快速整合各种来源的数据,并保证分析使 用数据的质量;实施和相关标准兼容的数据模型和 知识构架,确保不同临床系统和外部临床数据集市 的一致性。数据隐私保护上,也需要对“何种方式使 用数据,谁使用数据、使用目的”等方面制定严格的 标准。 3.2.4搭建一个共享平台 大数据使公众获取数据集成为一个问题, 各国都建立了自己的“医学数据银行”或者公开的门 户网站(如data.gov),提供基础的数据获取渠道。 我国也亟需整合各方面资源,建立中国健康大数据 研发中心,形成中国健康大数据研究智库。 3.2.5培养一支专业队伍 大数据建设的每个环节都需要依靠专业人员完 成,因此必须培养和造就一支懂指挥、懂技术、懂管 理的大数据建设专业队伍。大数据的人才缺口巨 大,据盖特纳咨询公司预测,大数据将为全球带来 440万个IT新岗位和上千万个非IT岗位。麦肯锡 公司预测,美国到2018年需要深度数据分析人才44 万一49万人,缺口14万一l9万人ul引。所以制定 者应该考虑在教育层面来吸引更多的学生学习和从 事大数据相关领域,尤其是要多培养数据科学家。 企业和其他单位则可以对具有数学、统计学等相关 学科学位的员工进行培训,使其成长为数据科学家。 (下转第59页) 中华医学图书情报杂志2015年1O月第24卷第l0期 Chin J Med Libr lnf Sci,Vo1.24 No.10 October,2015 ·59· 用户之间交流分散,存在小群体现象,有一些核心节 点与其他节点完全是零交流,造成了用户之间的信 息不能达到有效的共享,信息不能得到广泛的传播。 总体来说,这41位用户在自己的小团体中交流程度 比较密切,但是脱离了团体之后与其他团体成员交 流程度就很小。粉丝量较少的用户会关注粉丝量较 多的用户,但是同为大粉丝量之间的用户交流较少。 实现微博作为信息传播的社交媒体平台的价 【参考文献】 刘军.社会网络分析导论[M].北京:社会科学文献出版社, 20o4. 王陆.虚拟学习社区的社会网络分析[J].中国电化教育, 2009(1O):5—11. 邱均平,李威.基于社会网络分析的博主与评论者关系研究: 以“科学网博客”为例[J].情报科学,2012,30(7):959—963. 宋恩梅,左慧慧.新浪微博中的“权威”与“人气”:以社会网络 值,加强健康信息用户之间交流,促进健康信息的传 播仍然需要新浪微博平台和用户之间的共同努力。 首先要加强微博健康社区中核心成员之间的交流, 提高核心用户的活跃度,鼓励健康信息的发布,加强 分析为方法[J].图书情报知识,2012(3):43—54. 马霞,甄天民,谷景亮,等.社会网络分析方法在国内医药卫 生领域的应用及启示[J].中华医学图书情报杂志,2014,23 (1O):18—21. 刘军.整体网分析讲义:UCINET软件实用指南[M].上海: 信息的传播;其次,微博平台应为用户创造良好的交 流氛围,加强网络社区用户间的交流。 5结语 上海人民出版社。20o9:6O一65. 邵云飞,欧阳青燕,孙雷.社会网络分析方法及其在创新研究中 的运用[J].管理学报,2009,6(9):1188一l193,1203. 本文分析了新浪微博中粉丝数量较大、影响力 潘伟,王伟,王坤,等.基于中心性分析的知识型员工对 更大的健康信息用户之间的信息交流情况,但在所 医药企业知识共享的影响[J].中华医学图书情报杂志,2014, 23(1):19—24. 传播的健康信息内容、真实性、可靠性等方面信息并 未进行分析和评价,健康信息用户之间信息交流和 [收稿13期:2015—08—12] [本文编辑:黄思敏] 传播的机制和主要障碍等也需要进一步研究。 (上接第17页) 【参考文献】 [1]Transforming Health Care Through Big Data[R].New York:Insti- tute for Health Technology Transformation,2013. [8] 世界最先端IT国家创造宣言 变更 ̄z-'9 0、 [R].东京:各 府省情鞭化统括寅任者(ClO)遵络会谶,2014. [9] he MiTnistry of Healh and Weltfare Unveils a Blueprint for the [2]The big-data revolution in US health care.Accelerating value and Heahheare Industry in South Korea[EB/OL].[2015—04-26]. https://adalidda.eom/en/business—news/healhCare—itndustry— insouth—korea. innovation[R].New Jersey:MeKinsey&Company,2013. [3]Analytics in Helatheare[R].Venron Hills,IL,US:CDW Health— care.2015. [1O] Minister SH,Singapoer Helatheare 2020 Masterplan[R].Singa- pore:Ministy ofHearlth,2012. [4]Healtheare and Life Sciences Predictions 2020[R].London:De loitte Centm for Health Solutions,2014. 2l世纪经济报道.中国酝酿精准医疗计划显著区别美国版 [5]Precision Medicine Initiative[EB/OL].[2015-02—07].http:// www.nih.gov/precisionmedieine/. 本[EB/OL].[2015一o4—28].hap://business.sohu.corn/ 20150428/n41201 1383.shtm1. [6]王茜.英国大数据战略分析[J].全球科技经济嘹望,2013, [12] Big data:The Next Frontier for Innovation,Competition,and 28(8):24—27. Productivity[R].New Jersey:MeKin ̄y Global Institute.2011. [收稿日期:2015—08—10] [7] Nigel Shadboh MC,Big data,big new businessses[R].New Jersey:McKinsey Global Institute,2014. [本文编辑:黄思敏]