新型コロナウイルスに関連した患者の死亡の統計

https://www.bousai.metro.tokyo.lg.jp/taisaku/saigai/1010035/1012790/index.html
ここから辿ると、死亡情報が例えば、

https://www.bousai.metro.tokyo.lg.jp/taisaku/saigai/1010035/1012790/1012818.html

のように得られます。年代・性別・居住地・診断日・死亡日が得られます。これに報告日をつけて、次のようなテーブルを得ました。

発表日 番号 年代 性別 居住地 診断日 死亡日
2021/1/14 1 90代 男性 都内 2020/12/9 2020/12/27
2021/1/14 2 70代 女性 都内 2020/12/27 2021/1/13
2021/1/14 3 80代 男性 都内 2020/12/31 2021/1/13

以下略

ただし、10/29以前はPDFでの情報提供のため、ここでは10/30以降の情報になっています。
これをRに読み込みます。

table <- read.csv2("death.csv", sep=",", colClasses=c("Date", NA, NA, NA, NA, "Date", "Date"))

発表日、診断日、死亡日のヒストグラムを描きます。

png("発表日.png")
hist(table[, 1], breaks="days", xlab="published day", freq=T, format="%m/%d")
dev.off()

f:id:inamori:20210116154127p:plain

png("診断日.png")
hist(table[, 6], breaks="days", xlab="diagnosis day", freq=T, format="%m/%d")
dev.off()

f:id:inamori:20210116154152p:plain

png("死亡日.png")
hist(table[, 7], breaks="days", xlab="death day", freq=T, format="%m/%d")
dev.off()

f:id:inamori:20210116154220p:plain

発表日より死亡日の方がバラツキが少ないことが分かります。
あと、死亡から発表のタイムラグと、診断から死亡までの日数が気になるので、これらもヒストグラムにします。

png("死亡から発表.png")
v <- as.integer(table[, 1] - table[, 7])
bins <- seq(min(v), max(v))
hist(v, breaks=bins, xlab="death to publish", freq=T)
dev.off()

f:id:inamori:20210116154658p:plain

png("診断から死亡.png")
v <- as.integer(table[, 7] - table[, 6])
bins <- seq(min(v), max(v))
hist(v, breaks=bins, xlab="diagnosis to death", freq=T)
dev.off()

f:id:inamori:20210116154717p:plain

診断から死亡はマイナスもけっこうあります。