伤害信息分析历史
1. 教堂衍生的大数据:格朗特的死亡率表
这个项目是要建立一个基础平台,即使是在伤害信息领域,这也并不是一个新的尝试。很久以前,约翰.格朗特(1620 - 1674)第一次探索人口统计数据是基于教堂的洗礼和葬礼的记录完成的。在统计史上,他被认为是“人口统计学的奠基人”,也可能被认为是伤害数据科学领域的先驱。格朗特分析了从1604年到1664年的60年间墓葬的数量,并根据81种不同的死亡原因将这些死亡分类并制作了一个表。然而,死亡的原因是由一些并不专业的验尸官记录在案,因此不能有效地使用。尽管如此,格朗特还是能够在伤害数据中发现一种规律性,因为他发现死亡原因中有几个与葬礼的总数总是保持着固定的比率。同时,他还构建了事故伤亡表,并指出在溺水,自杀和各种事故中可以观察到类似的现象,因为事故死亡人数是有规律性的。他的观点认为,通过数据分析可以观察到一定程度上伤害发生的规律性,这可能被认为是伤害数据科学的开端。此外,格朗特还利用所谓的“生命表”对人口统计数据进行了评估。埃德蒙·哈雷(Edmond Halley)继续完善了这张生命表,它奠定了人寿保险的数学基础。
在19世纪中期,也就是格朗特的时代之后大约200年,欧洲的一些城市开始进行人口调查。与以往一样,死亡的原因各不相同。这凸显了死亡原因科学分类的必要性与重要性。在此背景下,国际疾病分类和相关健康问题(ICD)也就应运而生。这一科学分类系统的开发首次使从原始数据中准确地提取信息成为可能。
海因里希(1886 - 1962)以其同名的海因里希定律而闻名,他被认为是对事故的定量评价并建立了事故的定量评价新前沿。海因里希是旅行者保险公司的一名工程师,他分析了有关工业事故保险索赔的大数据。他还发现了一些其他的实证法,例如著名的1:30:300规则,强调安全措施对管理人员的重要性,以及工业事故可视化。从那时起,有关工伤事故的数据已成为各国劳动局的重要政策工具,并成为工业安全管理的基础。国际劳工组织(劳工组织)的设立促进了有关工业事故的数据标准的国际标准化,并使工业事故数据库得以发展,以便进行国际比较。
2. 流行病学方法的演变: Snow, Nightingale, and Haddon
1831年,当英格兰被霍乱爆发所困扰时,一名名叫约翰· (1813 - 1858)的医生注意到了感染病人的起源与公共水井的位置之间的关系。他意识到霍乱不是在空中传播,而是通过饮用水传播,因此采取有效措施就可以防止进一步传播感染。不久之后,在克里米亚战争前线的斯库塔里医院中有位名叫的护士弗洛伦斯·南丁格尔(1820 - 1910)。她认为战地医院糟糕的卫生条件是导致许多士兵死亡的原因。她在战地医院搜集死亡率统计数据,并用这些作为具体的证据来抗议顽固的军队指挥官。因为军事指挥官拒绝承认医院在恶劣的条件下运作。于是,随着南丁格尔的提议立即生效,士兵的死亡率迅速下降。
斯诺和南丁格尔之后的几十年,罗伯特·科赫等人相继发现各种病原制剂。换句话说,这些活动提出了了可行的措施,同时这些是基于对疾病发生的数据和环境因素结合起来的。因此,流行病学诞生了。
在医学领域,阐明疾病的病理原因与检查流行病学原因是同时进行的的。美国国家高速公路安全机构的一名工程师威廉.哈顿(1926 - 1985),论证了除了检查工程和人为因素之外,还可以采用流行病学方法来确定事故发生过程的原因。在20世纪60年代,交通事故的激增已经成为美国的一个巨大的社会问题。为了解决这一问题,哈顿制定了现在被称为“哈顿矩阵”(Haddon Matrix)的框架,该框架能够全面评估交通事故和干预策略。这个矩阵是一个流行病学的框架,它促进了人们对事故发生的广泛回顾,垂直方向代表时间线(事故前,事故发生,事故后),水平方向代表了导致事故的各种因素(人为因素,车辆和设备因素,以及环境因素)。基于这个框架,哈顿提出了各种措施用于减少事故伤害,比如使用安全带。他给出了一个令人震惊的数据:一辆汽车的整个生命周期中发生交通事故的概率是惊人的,30辆汽车中有1辆会造成身体伤害,5辆车中有1辆会发生事故,并给乘客造成伤害。这也使得人们开始注意碰撞安全设计的重要性。这一信息是在汽车工程师协会(SAE)的德克萨斯分部和地区医疗协会的联合会议上提出的。尽管当时缺乏图表和数据,但一些关键的数据为报告提供了充分的说服力,同时强调了汽车需要改进的必要性和重要性。虽然流行病学框架以前仅限于疾病和公共卫生,但哈顿将它们的应用扩展到事故,这些后来也被世界卫生组织采用。
3. 美国伤害监测网
在格朗特生活的17世纪,人们只有洗礼和死亡的记录。然而,生活在当今社会的我们拥有这各种各样的记录,包括事故和伤害。通过这些记录的应用,我们能够获得日常生活中伤害事故的高度准确信息。
20世纪60年代,由于产品缺陷,美国发生了大量事故。针对这种情况,美国政府迅速制定和实施了《消费品安全法》。该法案规定,国家电子伤害监测系统(NEISS)的立刻启动,该系统旨在系统地获取信息,不仅包括工业和交通事故,还包括在生活空间(在家里、在休闲、在学校等)发生的事故。在全国近6000家急诊医院中,选取130家医院进行抽样调查,然后根据编码手册开展伤害数据分析。(美国政府的统计数据几乎完全是基于统计推断,几乎不依赖于涉及整个人口的描述性统计数据。)这与日本形成鲜明对比,后者倾向于使用完整切全面的调查。
目前,该系统每年收集大约37万例伤害信息,这表明在美国所有医院中,每年有1300万人受伤。消费者产品安全委员会的一名官员估计,在没有医院治疗的情况下,总共有大约34,000,000人受伤。这些数据式可以在线下载和分析。虽然记录的项目数量有限,但数据可以作为大数据进行分析,因为数据的编纂包括年龄、性别、事故地点、治疗类型、受伤的身体部分以及造成事故的产品类别等。其他数据库包括伤害和潜在伤害事件(IPII)数据库,这其中包含未遂事故信息(大约每年30000例);死亡证明(dth)数据库,其中包括死亡产品信息 (每年约8000例);和四阶段深入调查(INDP)数据库(大约每年8000例)。
4. 欧洲伤害信息的无国界共享
1985年欧洲市场一体化,发达国家间合作和分享伤害信息的的程度更进一步。以前,每个国家都有自己的交通、工业和生活空间事故监测系统。此时,这些系统被整合,所有的伤害信息被合并成大数据。快速交换信息系统(RAPEX)是欧盟(EU)产品召回的紧急警报系统。该系统支持在整个欧盟内共享信息,也就是说一个地区内所识别的高风险产品的信息可以传送到其他国家。
5. 世界工厂:中国伤害信息系统引发广泛关注
当今社会,世界各地的日常用品(如纺织品、玩具、日用品和家用电器)几乎都是中国制造。全球消费者的生活方式在很大程度上依赖于中国产品。有一段时间,《中国制造》(Made in China)一书在美国非常畅销。该书作者的结论是,没有中国产品的生活是非常困难的。由此在这种背景下,全球消费者对“中国产品到底有多安全?”这个问题非常感兴趣。
日本,美国,欧洲三方负责消费者产品安全的主管部门已经与中国质量监督检验检疫总局合作,并为中国制造商在海外市场上的产品建立了产品召回信息的反馈渠道。 希望这将有助于改进。
此外,中国消费者也越来越关注产品安全,并且要求制造商和政府将重点放在国内消费者身上。由此,中国政府于2007年启动了国家伤害监测系统(NISS),并收集全国各地的伤害信息。此系统与美国和欧盟类似,信息收集渠道由急救医院组成。截至2013年,18个省份的22家医院参与收集了信息,目前医院数量已增至54家。虽然系统收集了约5万件与产品相关的伤害案件的资料,但是这些数据的使用范围是有限的,并不适用于所有用户。
6. 信息多样性:日本的伤害信息系统
此前伤害事故的例子来自其他国家的信息系统, 同时这些系统的信息来源主要是急救医院。然而日本与美国和欧洲则是大相径庭,日本系统采用各种各样的信息来源,如企业、消费者、消费者事务中心、医院、和报纸文章。自20世纪70年代以来,日本已经发展了多个伤害信息系统,其中包括日本PIO-NET的国家消费者事务中心(信息源包括消费者投诉信息和医院),以及国家技术与评估研究所的产品事故信息数据库(NITE;信息源包括来自企业的报告)。随着2009年日本消费者事务厅的成立,各种伤害信息系统在这个机构的事故信息数据库系统中得到了巩固。由于这个系统并不是按照单一的协调设计原则建立的,所以在记录的项目和分类上是不同的。因此,虽然它可以被描述为统一,但实际上,这个数据库是一个缺乏系统的表述。美国和欧洲的系统涉及到事故发生地点(即医院)的数据输入时,通常选取一个较远地点,但是日本的信息来源往往更接近事故地点,以便于能够对事故作出较为详细的描述。此外,NITE数据库具有进行验证并实验操作的特殊功能.
根据2007年实施的严重事故报告制度,企业需要向消费者事务局报告严重事故(如死亡事故,重伤和火灾事故)。 尽管这是强制性任务,但是企业向消费者事务局报告的事故数量仍然在每年约20,000例,这仅仅占日本发生的所有事故的一部分。 美国NEISS每年收到370,000份报告,并采用抽样设计来估算全国各地的事故总数。 相比之下,日本的数据并不是根据科学抽样方法收集的,因此不能用于制定国家估计数据。
出于同样的原因,目前我们还不清楚根据年龄和地点的综合结果是否可以预示着总体趋势。以下是评估的系统的国际比较。
日本大量的伤害信息数据目前仍然处于休眠状态。例如,救护车每年约发600万次(2014年),其中大约有160万次,涉及伤员或中毒患者。每一位患者的病情都由医护人员记录,他们也会收到来自医院的病人诊断和治疗的记录反馈。其中一些信息已经被火灾和灾难管理机构(FDMA)数字化和整合。接下来,每年大约有6万起火灾发生。每一次火灾被控制后,有关人员对火灾原因进行现场调查,并在详细的火灾调查报告中记录结果。同时,每年大约有100万份由警察局提出的交通事故报告。在门诊和住院病人的病历中都记录了受伤和中毒的医疗信息。此外,数据中还记录了保险索赔数据的详细信息。每年约有6亿例受伤或中毒患者。当受伤或中毒导致死亡时,医生必须填写死亡证明并向市政府提交死亡通知书。这些病例的年数超过40万(意外死亡,2014年)。
这些统计数据会在FDMA和警方的白皮书以及年度报告中出现,这些数据也可以作为人口生命统计的一部分。 虽然FMDA或警察白皮书包括所记录事故的各种分析,但是个别记录是不能发布用并于分析的,而这些数据依旧尘封在政府机构的文件或沉睡于计算机内等待开发。