新型コロナウイルス感染症(COVID-19)による不安や深刻な状況が続く中、私たちGitHubが感動したことは、科学者、政府職員、ジャーナリスト、プログラマー、関心を持つ一般市民が、グローバルコミュニティの一員として、COVID-19に対する正しい理解と適切な対処方法の共有を目指して、さまざまなプロジェクトで協力し合っている様子です。その多くは従来型のソフトウェアプロジェクトではないにしても、このような多くの人たちのコラボレーションによって開発されるモデルは、データセットのキューレションやDIYのように自分で開発を進められるテンプレートとして採用されています。
COVID-19に関する情報の追跡、理解、対策を目的とする極めて影響力の大きいオープンソースプロジェクトの一部をご紹介します。
パンデミック(世界的拡大)の状況追跡で連携
COVID-19について、最も引用されているオープンデータセットの1つは、ジョンズ・ホプキンズ大学が提供するデータセットです。世界中の疫学者、ジャーナリスト、統計学者が、このデータセットをCOVID-19の感染拡大に関する正規データソースの1つとして扱っており、COVID-19感染報告をリアルタイムに追跡するための、インタラクティブなダッシュボードでも使われています。The Lancetに掲載された記事によると、このダッシュボードは、「研究者、公衆衛生機関、一般市民向けに、感染症の拡大状況の追跡を可能とし、誰もが使えるツールの提供を目的」として、ジョンズ・ホプキンズ大学のシステムサイエンス・エンジニアリングセンター(Center for Systems Science and Engineering;CSSE)によって開発されました。
さまざまな情報源(主に、DXY)から集められたデータを、WHOをはじめとする他のソースの情報と照合することで検証しています。各国の初感染例に関する情報は、通常、WHOよりも早くこのダッシュボードに伝えられます。ジョンズ・ホプキンズ大学のチームは、適切な対処方法という重要な情報をウイルス感染拡大の早い段階で提供できる点において、このダッシュボードは非常に有効であるとしています。[1]
ワシントン大学の保健指標評価研究所(Institute for Health Metrics and Evaluation;IHME)が提供するnCoV2019も、一般に公開されている高品質データセットの1つで、こちらのダッシュボードで閲覧することができます。このデータセットには、感染症状の発現日や確認日など、各患者の詳細なデータが含まれており、COVID-19の再生産数や潜伏期間など、重要な統計データを導くために使用されています。[2]
米国内での感染追跡
米国内の検査率や感染率について、最も包括的な情報提供を行っているのがCOVID-19 Trackerプロジェクトです。[3,4] このプロジェクトのデータは、ウェブページやGoogleシート、またはパブリックAPIを介して閲覧することができます。このプロジェクトは、3月初旬にアメリカ疾病管理予防センター(CDC)から検査情報が発表されない事態を懸念したRelated Sciencesの創設者と、The Atlanticとの業務提携からスタートしました。両社はボランティアを公募し、各州のウェブサイトをクロールしてデータを集約し、APIを介してデータセットを一般公開するためのソフトウェアパッケージ一式を短期間で開発しました。プロジェクトは速やかに進められ、ソースコードとデータセットが共有されました。以前、Our World in DataのCOVID-19検査に関するページには、CDCが発表するデータとCOVID19 Trackerのデータの両方が掲載されていましたが、現在ではCOVID19 Trackerのデータのみが掲載されています。
大規模調査のためのボランティアコンピューティング
COVID-19については疫学的な研究だけでなく、ワクチンや治療法の発見を目的とした科学的な研究も行われています。「Folding@home」は、コンピューターによる医薬品の設計を始めとしたさまざまな目的のために、ボランティアが提供するPCを使って、分子動力学モデリングを行う分散コンピューティングプロジェクトです。同プロジェクトは、COVID-19を的に絞り創薬標的の候補としてのタンパク質を発見するための取り組みを開始しました。このプロジェクトのデータは、こちらのレポジトリに保存されています。Folding@homeはオープンソースプロジェクトであるため、そのデータセットやソフトウェアはすべて公開されています
一般向けサポート
世界保健機関(WHO)のアプリチームが、COVID-19と戦う世界中の人々をサポートするためのモバイルアプリ開発を急ピッチで進めています。ダニエル・クラフト(Dr. Daniel Kraft)氏が率いるこのアプリチームが、初版の開発を急いで進めており、住民に地域の情報を提供するだけでなく、その他のユーザーに正確な情報を伝えるため、公衆衛生当局へのフィードバック機能を備えたアプリの開発を目指しています。
科学的対策の迅速な適用
Nextstrainは、病原体ゲノムを追跡および解析するためのオープンソースプロジェクトです。COVID-19の遺伝疫学的データを提供するダッシュボードを運営しています。このダッシュボードは、ヒト コロナウイルス(HCoV-19)の突然変異に関わる進化的関係を示すものです。ここから、ウイルスの起源に迫ることができるかもしれません。Nextstrainプロジェクトは、このウイルスを疫学的に理解し、大規模な感染拡大を防ぐ対策の強化を目指しています。Nextstrainのウェブサイトには、「現在の科学出版のあり方では、疫学的に有意な結果が迅速に流布されない」と明記されており、同チームは質の高いデータを素早く提供し、パンデミックの発生によるダメージを最小限に抑えることに尽力しています。NextstrainのCOVID-19関連ダッシュボードでは、厳しい共有ガイドラインが定められているものの、GISAIDのデータが使用され、ソフトウェアはすべてがオープンソースです。
他にも、こちらの胸部X線写真レポジトリのように、診断の精度を上げ、感染予測をサポートするAIの開発を目的とした小規模な科学的データセットも多く存在します。
データの可視化
COVID-19に関する科学データの可視化を目的とする多くの小規模プロジェクトが進行しています。Novel Coronavirus Infection Map(新型コロナウイルス感染症の拡散状況マップ)は、世界的な感染拡大の履歴だけでなく、各国の感染状況も視覚的に表示します。このマップは、ワシントン大学のHumanistic GIS Labが開発したもので、多数の政府組織や公衆衛生機関から取得したデータが反映されています。
COVID-19 Scenariosは、感染症の拡大に伴う各地の医療機関の負担を判断するために設計されたCOVID-19感染シミュレーターです。
COVID-19 Dashboardsは、ジョンズ・ホプキンズ大学のCOVID-19データをインタラクティブに表示するダッシュボードです。Jupyter Notebooksで構築され、fastpagesを使ってブログに変換されます。COVID-19 Dashboardsのデータセットは、GitHub Actionsによって最新状態に保たれているため、最新情報が常に視覚化されています。このサイトは、全体がボランティアのプログラマーやデータサイエンティストによってオープンソースで構築されています。このサイトには、可視化だけでなく予測も含まれており、予測モデルのソースコードを直接調べることができるため、オープンソースのアプローチに適しています。(fastpages は、生成されたウェブページに直接埋め込まれたソースコードを表示します)
同様に、Predict COVID-19(レポジトリ)を使用すれば、各国のCOVID-19感染者数を比較することができます。これにより、今後の感染拡大を予測することが可能になります。
COVID-19関連データへのプログラマティックなアクセスを簡素化するため、このような多数のプロジェクトが開発されました。ジョンズ・ホプキンズ大学のデータを提供するAPIで多くのCOVID-19関連情報を可視化したサイトが作られており、リアルタイム情報が可視化するレスポンシブルデザイン対応のサイトが20件近く誕生しています。
国家、州、自治体、コミュニティ
イタリアは、COVID-19に関する国内の最新データをすべて共有しています。イタリア全土の感染状況をリアルタイムに追跡するダッシュボードも、このデータを利用しています。同様に、東京やチューリッヒなどのさまざまな大都市が、GitHubのレポジトリを介して、感染情報をリアルタイムに保存、共有しています。
武漢2020コミュニティプロジェクトは、「このウイルスとの戦いに貢献するすべての人々のために、病院、工場、調達、その他の情報をリアルタイムに同期させるデータサービスの確立」を目指した、自立的なオープンソースのコミュニティプロジェクトです。
人工呼吸器のDIY(自作)
最後に、Low-Cost Open-Source Ventilatorプロジェクトは、低コストで人工呼吸器を製作する方法について、幅広い情報を提供しています。医療機関で標準的な人工呼吸器が不足した場合、これが人々の命を救うことになるかもしれません。
増加するプロジェクトやコントリビュータ
COVID-19関連のプロジェクトと貢献者の数は急増しています。過去2ヶ月間のフリー・オープンソース(FOSS)プロジェクトだけでも、世界中の3,000以上のCOVID-19対応プロジェクトをサポートする、6,000人以上のコントリビュータがいます。これまでのところ、これらのプロジェクトは140,000人以上のユニークユーザーによって200万回以上閲覧されています。
最近追加されたCOVID-19プロジェクト
COVID-19に関連したプロジェクトは日々増加しています。もしあなたのプロジェクトがCOVID-19に関したものである場合、多くの人に発見してもらえるように、 ‘covid-19’ というトピックタグをつけることを強くお勧めします。先週公開されたプロジェクトの中には、以下のようなものがあります。
- ニューヨーク・タイムズ紙は最近、米国の州および国全体の情報源からコンパイルされたCOVID-19データセットを公開しました
- オンタリオ州は、COVID-19自己評価ツールのソースを公開し、他の人が簡単に使用できるようにしました
- ボランティアグループがインドのCOVID-19 Trackerを作成しました。これはGitHub Pagesを使って構築・公開されている数多くのダッシュボードの中でも特に優れた例です
COVID-19プロジェクトのためのGitHubのサポート
GitHubは、このように多くのコントリビュータが互いにコミュニティにおいて協力し合い、COVID-19の感染拡大防止と戦うための対策を講じている様子に感銘を受けています。既に、1日あたり60,000時間分の計算能力を、GitHubからFolding@homeに提供しており、他のプロジェクトにもサポートを提案しています。COVID-19関連プロジェクトでGitHubの製品やサービスが必要な方は、プロジェクトに関する情報と共に、GitHubに依頼したい内容を添えて、 弊社までお問い合わせください。
[1] John Hopkins: COVID-19 Map FAQs
[2] Our World in Data: nCoV-2019 Data Working Group data
[3] Talking Points Memo: Key Source of COVID-19 Testing and Infection Data
[4] The Atlantic: How to Understand Your State’s Coronavirus Numbers