首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >从newspaper3k获取文章,而不是从URL获取文章

从newspaper3k获取文章,而不是从URL获取文章
EN

Stack Overflow用户
提问于 2021-07-13 10:34:21
回答 1查看 163关注 0票数 2

我正在使用newspaper3k内部的Scrapy解析方法。我想提取链接,但我不想再次获取网站。

是否可以使用这个方法:

代码语言:javascript
复制
newspaper.build(..)

使用普通的html,这样我就可以调用.articles than?

EN

回答 1

Stack Overflow用户

发布于 2022-05-27 11:10:06

我找到了这个解决方案:

代码语言:javascript
复制
import httpx

from newspaper import Article

async def get_article(url):
    with httpx.AsyncClient() as client:
        response = await client.get(url)

    article = Article(url)
    article.set_html(response.text)
    article.parse()
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/68360767

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档