傷害情報分析の歴史

1. はじまりは教会ビッグデータ:グラントの死亡表

本プロジェクトの目指すエビデンスベースの構築という課題は、傷害情報の分野だけに限ってみても決して新しいものではない。古くをたどると、教会の洗礼簿、埋葬簿から人口統計を作りだしたジョン・グラント(1620-1674)の取り組みを挙げることができる。統計学史において彼の名は「人口統計の開祖」として記録されており、傷害データ科学にとってもパイオニアと言うべき人物である。グラントは1604年から1664年までの約60年分の埋葬者を調べ、81種類の死因別にカウントした死因表も作成した。しかし、当時の死因は「無知な検屍役」によって書かれたものであって有効に活用されることはなかったが、「死因の幾つかは埋葬総数に対する比率が一定比率を保つ」として、グラントは傷害データにある種の規則性があることを見出した。グラントは「事故死表」(table of casualties)も作っており、「同様の現象は溺死、自殺及び種々の事故死等についても見られる」と述べ、事故による死亡にも規則性が見られることを報告した。データの観察から傷害の発生に一定の法則性を見出すことができるかもしれない、という彼の洞察は、いわば「傷害データ科学」の曙を宣言する洞察だったと言ってよいだろう。グラントは「生命表」と呼ばれることになる人口動態の推計も行った。これは後にハレーによって精緻化され、生命保険の数理的基礎ともなった。

グラントの時代から約200年近くが経過した19世紀の中ごろになると、ヨーロッパの幾つかの都市で人口調査が行われるようになっていたが、相変わらず死因分類はまちまちであり、科学的な死因分類を開発し、世界共通のものとして定める必要性があった。こうした中で生まれたのが、今日の国際疾病分類ICD(International Classification of Diseases)である。こうした科学的な分類体系の発展によって初めて収集されたデータからより正確な情報を取り出すことができるようになった。

一方、事故の数量的把握に新境地を開いた人物として、「ハインリッヒの法則」で有名なW・H・ハインリッヒ(1886-1962)を挙げることができるだろう。彼はアメリカの損害保険会社トラベラーズのエンジニアであり、保険会社に申請された労災事故補償を求めるビッグデータの解析を行い、有名な1:30:300の法則のほかにもいくつかの経験則を見出し、労災を「見える化」して経営者に安全対策の重要性を説いた。その後、労災事故・傷害に関するエビデンスデータは各国の労働政策当局にとっても重要な政策ツールとなり、労働安全行政の基礎として成長した。ILOができてからは労災事故に関するデータ基準の国際標準化も進み、国際比較可能な労働災害データベースの整備が行われるようになった。

2.疫学アプローチの展開:スノウ・ナイチンゲール・ハドン

1831年にイギリスでコレラが流行した際、医師ジョン・スノウ(1813-1858)は患者発生地点と井戸の位置との相関に注目し、コレラが空気感染ではなく汚染された飲料水による感染だと気づき、効果的な伝染病対策を講じた。少し後、クリミア戦争の前線スクタリに赴いたナイチンゲール(1820-1910)は、兵士たちの死因が野戦病院のひどい衛生状態にあることを見抜き、野戦病院の死亡統計を整備し、不衛生な病院運営の非を認めようとしない頑迷な陸軍指導者らに対して具体的なエビデンスをもって反論した。彼女の対策はてきめんに効果を発揮し、兵士の死亡率は急速に低下した。

スノウやナイチンゲールの活躍は、コッホらによって次々と病原菌が発見される数十年も前のことであった。医学的な因果関係究明に先立って、病気の発生と環境因子との組み合わせに関するエビデンスデータの解析から実効性ある対策が生み出されたわけだ。疫学の誕生である。

医学において病理学的な原因究明と疫学的な原因究明とが並んで行われるように、傷害の発生についても、事故発生プロセスに関する工学的・人間工学的解明と並んで疫学的な原因究明があり得るということを示したのは、米国高速道路局のエンジニアだったハドン()である。1960年代、米国では交通事故の増加が大きな社会問題となった。そこで、ハドンは交通事故対策を総合的に検討するための枠組みとして今日ハドンマトリックスとして知られる枠組みを提案した。これは事故発生前、事故発生時、事故発生後という時間軸を縦軸に、被害者としての人間、加害物としての自動車や設備、環境要因という傷害発生の諸要因を横軸にとった行列であり、事故発生過程を広くとらえる疫学的枠組み。この枠組みに基づき、ハドンはシートベルト着用などの諸対策を提案し、それらは大きな効果を挙げた。彼は一台の車両がそのライフサイクルを通じて傷害事故の当事者となる確率について、対人事故については30台に一台、搭乗者自身の事故については5台に1台という衝撃的なデータを示し、「衝突安全設計」の重要性を指摘した。これは米国の自動車技術会(SAE: Society of Automotive Engineers)のテキサス支部と地域医師会の合同会合で発表されたものであり、一枚のグラフも表もないが、報告が説得的なのは、要所で具体的な数字をあげ、自動車自体の改良に取り組むことの重要性が説かれていることである。疫学的な枠組みはそれまで疾病対策や公衆衛生の分野に限られていたが、ハドンによって事故にも拡張されたことにより、後にWHOも採用するようになった。

3. 全国的な傷害サーベイランス網を作りあげた米国

17世紀のグラントの時代、人々の人生は洗礼と埋葬が記録に残されるだけだった。しかし、現代に生きる我々が遭遇する事故や怪我は様々な形で記録されている。そして、これを活用することにより、日常生活における傷害の発生は実はかなり正確に把握することができる。

米国では1960年代に欠陥製品等に起因する事故が多発。これを受け、いち早く消費製品安全法Cosumer Product Safety Actが成立した。そして、労災事故、交通事故のみならず、生活空間(家庭内、余暇、学校等)における事故も含めて、その発生状況を体系的に把握するためのシステムとして全米電子傷害サーベイランスシステム(NEISS)が稼働を開始した。全国約6、000の救急病院から厳密な統計的サンプル設計に基づいて130病院を選び、コーディング・マニュアルに従った傷害データの収集と分析が始まった。(ちなみに、米国の政府統計は推測統計学を多用しており、全数調査はほとんど行わない。この点、悉皆調査の好きな日本と好対照である。)

現在では年間37万件の傷害データが収集されており、全国規模では病院で治療を受けた傷害が1300万件発生していると推計している。あるCPSCのスタッフは、病院で治療を受けない傷害を含めた総件数は3400万と推計している。これらのデータはインターネット上でダウンロードして分析することが可能。記録されている項目数は少ないが、年齢、性別、発生場所、治療内容、傷害部位、起因物となった製品カテゴリーなどがコード化されているため、ビッグデータとしての解析を可能にしている。このほか、ヒヤリハット情報とも言うべきIPSS: Injury and Potential Injury Incident Data(年間約3万件)、製品による死亡事例としてのDTHS: Death Ceritifcates(年間8千件)及びINDP: In-Depth Investigations(年間8千件)という4階層からなるデータベースを整備している。

4. 国境を超えた傷害情報共有を目指すヨーロッパ

ヨーロッパでは、1985年の市場統合を経て、傷害情報についても各国間で協力を行い、情報をシェアするための取り組みが進んだ。また、それまで、交通事故、労働災害と生活空間の事故は別のサーベイランス体系によって把握されているが、これらが統合され、総合的な傷害情報ビッグデータとして整備されることになった。EUではリコール製品に関する緊急アラートシステムであるRAPEXも運用しており、域内で発見されたリスクのある商品についてはEU全域にわたる情報共有の仕組みができている。

5. 関心が集まる世界の工場中国の傷害情報システム

繊維製品、玩具・日用品、家電製品など広範囲の生活用品に関して、今日、世界中のどこでもメイド・イン・チャイナの占める割合は高い。世界中の消費者の生活は、かなりの程度中国製品に依存している。しばらく前に「One Year without Made in China」(中国製品を使わずに一年間暮らした人の手記)という本が米国でベストセラーとなったが、その結論は「それは極めて難しい」ということだった。それだけに、メイド・イン・チャイナの製品がどれだけ安全なのかは世界の消費者の一大関心事である。

消費製品の安全に責任を有する日米欧の当局は、中国の当局である「検査検定総局」と協力して、中国製品の海外市場における製品リコール情報を中国メーカにフィードバックするチャンネルを形成し、改善を促すインセンティブとして機能することを期待している。

一方、中国国内の消費者にも製品の安全問題への関心は高まっており、「国内の消費者にも目を向けよ」との声をあげている。これを受け、中国でも2007年から傷害情報に関する全国規模の収集システム―国家製品傷害情報システム(NISS:National Injury Surveillance System)を稼働しはじめた。米国やEUと同様、収集チャンネルは救急病院である。現時点では全国の18省、54病院が入力源となり、2013年まで22。5万件製品傷害データを収集され、しかし、まだ、その利用には制限があり、すべての利用者にとって開かれているわけではない。

6. 多様な情報の混合物:日本の傷害情報システム

これまでに見てきた各国の傷害情報システムがいずれも救急病院を主たる情報源としているのに対して、日本で現在稼働している傷害情報システムの情報源は、事業者、消費者、消費生活センター、病院、新聞記事など多種多様な情報源からなり、欧米のシステムとは性格のかなり異なる存在である。日本では、消費者からの苦情情報や病院からの提供情報を情報源とする国民生活センターのPIONET、事業者からの通報などを情報源とする製品評価技術基盤機構(NITE)の製品事故データベースなど、幾つかの傷害情報システムが1970年代から形成されてきた。2008年に消費者庁が発足したのに伴って、これらの各種事故情報システムが消費者庁の下に「事故情報データバンクシステム」として一元化されることになった。もともと統一的な設計方針に従って作られたものではないために記録項目や使用している分類も異なり、一元化されたと言ってもいわば混合物であって体系性には欠ける。一方で、欧米のシステムが病院という事故発生現場からは遠いところを入力源としているのに対して、日本の情報源は事故現場に近いところを情報源としているため事故を比較的詳細に記述しており、しかもNITEのデータベースでは事故の検証作業が行われているという点で優れている。

2007年に導入された重大事故報告制度の下では、死亡、重症事故、火災などの重大な事故については事業者に対して消費者庁に報告する義務が課されるようになった。しかし、こうして消費者庁に報告される事故件数は年間約2万件前後にとどまっており、日本で発生している事故の一部をカバーしているに過ぎない。米国のNEISSも約37万件であるが、サンプリング設計がなされているため全国合計地に関する統計的推定が行えるのに対して、日本の場合科学的サンプリングに基づいて収集されたデータではないため全国ベースの推定には使えない。

また、同様の理由から年齢別、場所別といった集計結果も全体の動向を反映しているのかどうかは不明である。これについては後述するレセプト情報から推計した結果との対比を行う。

米国 EU 中国 日本
名称 電子傷害サーベイランスシステム
(NEISS)
傷害データベース
(IDB)
国家製品傷害情報システム
(NISS)
事故情報データバンクシステム
作成機関 消費製品安全委
CSPC
EU本部
DG-SANCO
国家質検総局欠陥製品管理センター(DPAC)& 国家疾病予防センター(NCNCD) 消費者庁
情報源 救急病院 救急病院 救急病院 指名された病院 各種
アクセス可能な年間データ件数 30-40万件 数2万件/年
収録開始年 2007年試運用開始 2009年9月登録開始
主要な記載情報

7.埋もれている日本の傷害ビッグデータ

日本には多くの傷害ビッグデータが未利用のまま眠っている。例えば、救急車の出動回数は年間約600万回(2014年)、うち160万回程度は外傷や中毒による患者の搬送である。搬送された患者の状態は出動した消防隊員によって記録され、また病院で受けた診断や治療の内容に関する情報も救急隊にフィードバックされ、記録として残されている。その一部は電子化されて消防庁本部に集約されている。火災通報件数は年間約6万件。火災原因等についての調査結果は鎮火後の現場検証を経て詳細な火災報告に記録される。交通事故について警察署が作成する事故報告書は年間約100万件に達する。外傷や中毒の治療のために通院、入院した際には治療の内容がカルテに記載されるほか、支払い記録が健康保険の支払い記録(レセプト情報)として残される。その件数は外傷及び中毒だけでも年間6億件という膨大な記録である(外傷・中毒は25%程度か)。外傷や中毒が原因で死亡に至った場合、医師による死亡診断書が書かれ、自治体の窓口に死亡届が提出されるが、その件数は年間4~5万件(不慮の事故による死亡件数、2014年)に達している。

これらの記録を集計した統計データは消防や警察の白書や年報、あるいは人口動態統計として発表されている。消防白書や警察白書では事故記録に基づく様々な分析が行われているものの、個々の事故等の記録は公開されず、役所のファイルやコンピュータの中に眠っている。

死亡届 火災調査報告 救急搬送記録 レセプト情報入院・通院記録
作成者 親族→自治体 消防署 消防署
電子化の有無と対外提供の可否 ほぼ電子化されている〔厚労省保健情報部への聞き取り。統計法33条による個票提供の可能性あり〕 主要項目は電子化して消防庁に報告しているが、それ以外は各消防署内でペーパーベースで保存しているところが多いものと思われる。〔長岡消防署での聞き取り〕 同左 病院は99%以上電子化済み。NDBとして個票利用(サンプル抽出・匿名処理済み)促進のための窓口も設けられている。
主な記載項目 氏名
性別
生年月日
死因(ICD10)
火災種別
出火日時
覚知・鎮火時刻出火場所住所
事業所名・業態
建物の構造等
原因・発火源
焼損状況
焼損棟数
死傷者数
死傷原因
り災世帯・人員
損害額
気象状況
防火管理の状況
搬送日時
搬送者氏名
性別
生年月日
措置内容等
氏名(対外提供はハッシュID)
性別・年齢
都道府県コード
治療内容コード
傷病名コード
医療機関名
保険点数等