新型コロナ感染者数データを使いたい場合のデータ元

 



2021/1/07

分析などで新型コロナウイルスの感染者数データを使いたい場合の参照元を探してみたので、共有します。

厚生労働省

最も正確なのは国のデータでしょう。

厚生労働省 国内の発生状況など
https://www.mhlw.go.jp/stf/covid-19/kokunainohasseijoukyou.html

日本全体のデータなら、以下のオープンデータページにてCSVファイルが提供されています。

https://www.mhlw.go.jp/stf/covid-19/open-data.html

できれば都道府県ごとのデータが欲しいと思います。
上記ページの下部に「各都道府県の検査陽性者の状況」がありますが、PDFデータでしか提供されておらず、プログラムでは扱いにくいでしょう。

Google BigQuery

Googleは昨年、日本のコロナウイルス感染者数予測サイトを公開しました。

https://datastudio.google.com/s/nXbF2P6La2M

これに使われているデータはBigQueryのデータセットとして取得でき、各都道府県ごとに分かれています。

https://console.cloud.google.com/bigquery?project=homeyell&folder=&organizationId=&p=bigquery-public-data&d=covid19_public_forecasts&t=japan_prefecture_28d&page=table

もしPHPならBigQuery用の公式ライブラリを使い、以下のようなクエリで取得できます。

SELECT
*
FROM `bigquery-public-data.covid19_public_forecasts.japan_prefecture_28d`
WHERE prediction_date = "2021-01-01"
LIMIT 1000

厚生労働省が提供する都道府県ごとの感染者数は集計に2日(48時間)かかるため、BigQueryデータに実際の感染者数が入ってくるのも2日後になります。

都道府県ごとのサイトデータ

東京都は昨年(2020年)前半に、いち早く新型コロナウイルス対策サイトを開設しました。

このサイトデータはGitHubでオープンソースとして公開されており、dataディレクトリに感染者数データが含まれ、毎日更新されます。

このサイトデータを使い、オープンソースとして公開している道府県があります ので、紹介します。
(都道府県公式のもののみ)