我从网页上找了个约会对象,很难把文字提取出来
date_ <- html_nodes(page_, xpath = '//*[@id="particular_con"]/div[2]/text()')
## prints ##
# {xml_nodeset (1)}
# [1] 2017-03-27 我试着添加``[[(1L)或date_[[1]],但是这个打印
{xml_node}
<text>我只想提取2017-03-27
发布于 2017-04-04 12:44:14
只需使用html_text
如函数名所示,html_nodes返回一些指向节点的指针。要从它们中提取信息,请使用html_text和html_attr
将第一行改为:
date_ <- html_nodes(page_, xpath = '//*[@id="particular_con"]/div[2]/text()') %>% html_text()https://stackoverflow.com/questions/43207454
复制相似问题