忍者ブログ

[PR]

×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

エボラ出血熱の感染拡大を予測するデータ分析技術

エビルユーチューバーで稼げるまでサポートします

 世界保健機関の統計によると、これまでに確認されたエボラ出血熱の感染者は2万1689人、死者は8626人に上った。分析はウイルスとの戦いの鍵を握る武器として使われ、感染者数は減少に転じている。ギニア、リベリア、シエラレオネがこのウイルス性疾患と戦うために何よりも必要としたのは、照準の定まった医療援助だった。だが流行の規模があまりに大きく、援助の提供はロジスティック的な悪夢と化した。適切な援助を適切な場所に届けることは困難を極め、輸送インフラの不備や感染地域の広大さが事態を一層複雑にした。

 最も効率的な援助の配備を支援するため、IBMはエボラ追跡システムを提供した。市民は新規のエボラ感染について、電話やテキストメッセージで自分たちの位置情報を添えて中央ハブに直接報告を寄せる。この情報はデータ分析とクラウドコンピューティングを使って処理され、政府や援助団体が感染拡大状況を把握する助けになる。このデータがあれば、援助物資を最も必要とされる場所に届けることができる。

 この技術はエボラがどこに存在するのか、もっと正確に言えば、患者がどこで感染したのかについての情報を提供する。だが潜伏期間や診断にかかる時間のため、位置情報には数週間の遅れが生じることもある。

●結果のシミュレーション

 数学者はさまざまな技術を使ってエボラの感染がどう拡大するかを予測している。このおかげで政府や援助団体はリスクを知った上で医療介入に関する決定を下すことが可能になる。そうした技術の1つがモンテカルロ分析だ。

 確固とした結果の予測を目指す決定論的モデリングと違って、モンテカルロ分析では一連の結果予測を生成する。これは一連の変数の間の関連をベースとしている。サンプルは観測されたデータを表す所定の統計的分布から無作為に抽出する。このモデルを実行するコードを使い、個々のサイクルに関する数千件のシミュレーションを完了すると、生成されたデータは統計的に最も可能性の高い結果を提示する。

 「モンテカルロ分析では、流行の始まりから特定期間が経過した後の感染者数についての具体的な値は提示しない」。英サセックス大学数学部のエンリコ・スケーラス教授(統計・確率学)はそう解説する。「代わりに幅のある値が示され、それぞれに付随する確率、すなわちその値における確信の程度を測る尺度が示される」

●モンテカルロ分析の仕組み

 感染拡大をモデリングするモンテカルロ分析の手法では、人口統計データを使ってウイルスの流行モデルを作成する。ニュージーランドのマッセイ大学のクリス・ジュウェル講師(生物統計学)は、感染症の流行に関するリスク予測研究が専門。家畜の疫病のモデリングの事例として、「農場の場所、動物の数と種類、農場間の取引接触関係(動物の移動や機材の共有など)」を挙げた。

 要因は違っても、人から人へのウイルス感染のモデル作成にも同様のモデリング技術を利用する。スケーラス氏は言う。「疫病に関するモンテカルロ方式のシミュレーションを実施する場合、特異な状況で発生するその疫病の複製を何度も繰り返す。シミュレーションを実行するたびに、偶発性に起因するわずかな違いが毎回生じる。パラレルワールドや映画『スライディング・ドア』のように」

 「そうすると、例えば発生から20日後の感染者数についても異なった予測が出る。シミュレーションを1000回行って、そのうちの100回で感染者が1234人という予測が出れば、感染者が1234人になる確率は100対1000の総体頻度になる」

 ウイルス感染に関するモンテカルロ分析は2段階のプロセスで作成する。「実際に起きたことを基にこうしたシミュレーションを行い、そのデータに一致して最も合理的と思える感染率や報告率の推計を試みる」。英ロンドン大学衛生熱帯医学大学院の研究員、アダム・クハルスキ氏はそう解説する。

 「そうした値の推計ができれば、入手した値に基づき、次の数週間に予想される状況について、時間を先に進めたシミュレーションができる」(同氏)

 モンテカルロ分析では、提供されるデータの品質と精度に基づいて、どうなる可能性が最も大きいかに関する情報が提供される。それ自体で意思決定は行わないものの、意思決定の過程で利用できるデータを全てそろえた上で(複雑さはさておいて)、意思決定を促すことができる。

●回復モデル

 モンテカルロ分析は、コンピュータの処理能力とプログラミングの専門知識という2つの要素によって制約を受ける。モデルの精度を高めるほど、結果の生成にかかる時間は長くなる。理想とされる上限は16時間で、この時間であれば夜間にモデルが実行されるよう設定して翌朝結果を参照できる。

 必要なコンピュータ処理能力の提供にはGPUプロセッサとミニコアアーキテクチャが使われる。余分な複雑性をなくし、スリム化したシミュレーションでよりエレガントなモデルを作成すれば、シミュレーション時間は短縮される。

 例えば個人ではなくグループのモデリングを行う場合など、シンプルさが必要とされるときもある。一方、個々のレベルでのモデリングを実施すれば、結果の精度が高まり、例えば患者の予後(治療を受ける前に死亡、治療後に死亡、病院で回復、自宅で回復など)に関する統計的可能性の分布の差や、個々のケースにおける感染の統計的可能性が予測できる。

●エラーの制限

 モンテカルロ分析の鍵を握る要素として、利用できるデータは全て正確で、正しくモデリングされていることを確認しなければならない。完全性と正確性を保証するために割く時間とリソースを増やせば、大きな懸念材料になりかねない不確実性を最小限に抑えられる。

 モンテカルロ分析には「ごみを入れればごみしか出ない」という格言が当てはまる。モンテカルロ分析を行う前に、最大限のデータ品質を保証しなければならない。

 不正確なシミュレーションに基づいて行動すれば、不幸な結果を招くこともある。スケーラス氏は「シミュレーションでは、関連する状況をモデルに取り込むことができた場合にのみ、合理的な結果が提示される。それができなければ、シミュレーションに基づいて役に立たないことや間違ったことをやりかねない」と指摘する。

 どんなシミュレーションでもそうであるように、現実をどこまで正確にモデリングできるかには限界がある。特に個人や人口の移動といった要素にはそれが当てはまる。「人間の行動は、特に大流行の発生時は、モデルに組み込むのが非常に難しい要素の1つ。このようなケースでは、もっと抽象的な手法を採用して人口の中の週ごとの症例数や人口規模に絞り、地理や個人間の相互交流は無視した方がいいのかもしれない」とクハルスキ氏は言う。

 一方、ジュエル氏は技術を使って人口の移動をマッピングする方法にスポットを当て、「研究者たちは、もちろん匿名化した上で、携帯電話の基地局から基地局への移動記録を追跡している」と話す。この目的は、日々の人の動きや都市間の移動を正確にモデリングすることにある。

 シミュレーションにエラーが入り込んでしまうのは、現実を正確にモデリングできないことに原因がある。シミュレーションで予測する未来が先のことになればなるほど、そうしたエラーは大きくなり、やがてモデルの信頼性は失われる。この理由からモンテカルロ分析では、特に利用できるデータが限られる場合、できる限りシンプルさを保ち、予測にエラーが入り込むことを防いでいる。利用できるデータが増えれば、それをモデルに追加して精度を高められる。だが、複雑なモデルでは問題が発生する確率も高まる。エラーの侵入を制限するためには手堅いデータ検証戦略を採用しなければならない。

●シミュレーションした結果の応用

 「関連する状況を把握でき、感染がどう拡大するかをうまく知ることができれば、モンテカルロ分析のシミュレーションは疫病を食い止めるための信頼できる統計予測を提示できる」とスケーラス氏は言う。
 エボラ流行のようなケースでは、研究者がこの疾病の規模や、どう拡大する可能性が最も高いかを知ることができる。援助団体はこの情報を基に必要な医師と看護師の人数を把握して、事前に派遣の計画を立てられる。

 ウイルス流行のモデリングでは、特に流行の規模がもたらす影響を考える場合、有用な情報が提示される。ジュエル氏によれば、モンテカルロ分析の作成が「かつては考えたことがなかった側面を見つけ出すための思考の枠組み」の役割を果たすこともあるという。

 同様に、モデルの反復の中で変数を操作することによって、また、それぞれのシミュレーションから得られた最も可能性の高い結果を検討することによって、状況に対する理解を深め、結果にどのような影響を与えられるかについての理解を深めることもできる。そうした変数には、外出禁止令や学校閉鎖、隔離などが含まれる。

 モンテカルロ分析は、特にエボラ危機のようなウイルスの流行を伴う場合には、危機管理の必須要因になっている。だが、モンテカルロプログラマーの専門知識があってこそ、シミュレーションを合理化して精度を高めた結果を提供できる。そうした結果は戦略的に的を絞った医療介入や、エボラなどのウイルスの流行食い止めに利用できる。

 エボラワクチンは現在開発が進められているが、薬品会社が大量生産できるようになるまで供給は不足する。それを念頭に、モンテカルロ分析はワクチンを戦略的に配分して感染拡大を防ぎ、今後苦しむ人たちを最小限に抑える助けになるかもしれない。

【関連記事】


引用:エボラ出血熱の感染拡大を予測するデータ分析技術


せどりインサイダープロジェクトで稼げるまでサポートします
PR