https://www.bousai.metro.tokyo.lg.jp/taisaku/saigai/1010035/1012790/index.html
ここから辿ると、死亡情報が例えば、
https://www.bousai.metro.tokyo.lg.jp/taisaku/saigai/1010035/1012790/1012818.html
のように得られます。年代・性別・居住地・診断日・死亡日が得られます。これに報告日をつけて、次のようなテーブルを得ました。
発表日 | 番号 | 年代 | 性別 | 居住地 | 診断日 | 死亡日 |
---|---|---|---|---|---|---|
2021/1/14 | 1 | 90代 | 男性 | 都内 | 2020/12/9 | 2020/12/27 |
2021/1/14 | 2 | 70代 | 女性 | 都内 | 2020/12/27 | 2021/1/13 |
2021/1/14 | 3 | 80代 | 男性 | 都内 | 2020/12/31 | 2021/1/13 |
以下略
ただし、10/29以前はPDFでの情報提供のため、ここでは10/30以降の情報になっています。
これをRに読み込みます。
table <- read.csv2("death.csv", sep=",", colClasses=c("Date", NA, NA, NA, NA, "Date", "Date"))
発表日、診断日、死亡日のヒストグラムを描きます。
png("発表日.png") hist(table[, 1], breaks="days", xlab="published day", freq=T, format="%m/%d") dev.off()
png("診断日.png") hist(table[, 6], breaks="days", xlab="diagnosis day", freq=T, format="%m/%d") dev.off()
png("死亡日.png") hist(table[, 7], breaks="days", xlab="death day", freq=T, format="%m/%d") dev.off()
発表日より死亡日の方がバラツキが少ないことが分かります。
あと、死亡から発表のタイムラグと、診断から死亡までの日数が気になるので、これらもヒストグラムにします。
png("死亡から発表.png") v <- as.integer(table[, 1] - table[, 7]) bins <- seq(min(v), max(v)) hist(v, breaks=bins, xlab="death to publish", freq=T) dev.off()
png("診断から死亡.png") v <- as.integer(table[, 7] - table[, 6]) bins <- seq(min(v), max(v)) hist(v, breaks=bins, xlab="diagnosis to death", freq=T) dev.off()
診断から死亡はマイナスもけっこうあります。