練習問題
本節では、オープンデータを活用したデータ分析を体験することを目的とした練習問題を提供する。
ツールとしては、Microsoft Excelの利用を想定しているが、PythonやRを用いても同様のことが可能である。
問題
京都新型コロナウイルス対策サイトからオープンデータを入手し、以下の図のようなグラフを作成する。
グラフは、横軸に日付を、縦軸に陽性者数および7日間移動平均をプロットする。
画像引用:東京都新型コロナウイルス感染症対策サイト
なお、以下に注意すること。
- データの出典を明記すること(引用のルール)
- クレジットを明記すること(ライセンスのルール)
オープンデータの入手方法
- 「リソースへ行く」を選択してDL
- ライセンスも併せて確認するとよい。
画像引用:東京都新型コロナウイルス感染症対策サイト
ファイルの開き方
なお、CSVファイルは以下のように”\,”で区切られた形式となっている。
このファイルはExcelで直接開くことができる。
ヒント
各日の感染者数をカウントする
各日の感染者数をカウントする
- COUNTIFで以下を指定
- 範囲:「公表_年月日」
- 検索条件:「B2」
7日移動平均を取得する
- 基準日から7日分を合計し、7で割った値(7日間の平均値)を算出すればよい
- 7日目:1日目〜7日目
- 8日目:2日目〜8日目
- 9日目:3日目〜9日目
- 1日だけ急増、急減するような値(スパイク値)の影響を防ぎ、全体を俯瞰することができる