首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在路透社( Reuters )上只在某一特定日期之后才能抓取新闻文章

在路透社( Reuters )上只在某一特定日期之后才能抓取新闻文章
EN

Stack Overflow用户
提问于 2021-09-19 13:20:41
回答 1查看 123关注 0票数 0

我想从链接中提取新闻文章,因为你一直在向下滚动,旧的文章不断出现。但我只想要过去一年的信息。我怎么能设置那个过滤器?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-09-19 15:11:04

像这样试试。

下面的代码滚动到找到18 days ago为止。将条件更改为a year ago,当它找到一年前的消息时,循环就会中断。

代码语言:javascript
复制
from selenium import webdriver
import time

driver = webdriver.Chrome(executable_path="path to chromedriver.exe")
driver.maximize_window()
driver.implicitly_wait(10)
driver.get("https://www.reuters.com/companies/AAPL.O")

i=0
try:
    while True:
        news = driver.find_elements_by_xpath("//div[@class='item']")
        driver.execute_script("arguments[0].scrollIntoView(true);", news[i])
        if news[i].find_element_by_tag_name("time").get_attribute("innerText") == "18 days ago":
            break
        print(news[i].find_element_by_tag_name("a").get_attribute("innerText"))
        i += 1
        time.sleep(.5)
except:
    pass

driver.quit()
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/69243652

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档