这是我的密码;
library(rvest)
library(dplyr)
library(tidyr)
col_link <- "https://ourworldindata.org/famines#famines-by-world-region-since-1860"
col_page <- read_html(col_link)
col_table <- col_page %>% html_nodes("table#tablepress-73") %>%
html_table() %>% . [[1]]
new_data <- col_table %>%
select(Year, Country, `Excess Mortality midpoint`)
new_data我想用这样的方式来安排年份和国家,这样我就可以在图表中使用它们,但我不能。我的目标是复制这张图:

我的问题是,在“年份”栏中,一些数据对一个国家来说是持续数年的。例如,为了证明爱尔兰的饥荒从1846年一直持续到1852年,它写着"1846-52“,这是个问题,因为我不能用这种形式的数据作为图表。
Year Country `Excess Mortality midpoint`
<chr> <chr> <chr>
1 1846–52 Ireland 1,000,000
2 1860-1 India 2,000,000
3 1863-67 Cape Verde 30,000
4 1866-7 India 961,043
5 1868 Finland 100,000
6 1868-70 India 1,500,000
7 1870–1871 Persia (now Iran) 1,000,000
8 1876–79 Brazil 750,000
9 1876–79 India 7,176,346
10 1877–79 China 11,000,000
# ... with 67 more rows发布于 2022-01-22 16:13:05
我认为这更多的是一个数据问题,而不是R编程,你可以尝试将年周期与几十年相匹配。然而,如果一年的范围跨越几十年,数据应该以某种方式被“分割”(例如,做一个简单的比例分割)来适应这一点。如果你链接到的图表是用这些数据制作的,那么一些假设就必须调整数据,而不知道那些假设,你就无法重现图表。
https://stackoverflow.com/questions/70814393
复制相似问题