我正试着从新闻机构抓取文章,但我想不出如何用python找到一篇文章的作者。我已经阅读了文档,源代码,并搜索了谷歌。
from goose import Goose
def getArticle(url):
g = Goose()
article = g.extract(url=url)
print article.title
# print article.author
# print article.writer那么,是否有一个内置的方式来提取文章的作者使用python?
python代码和文档的链接:http://github.com/grangier/python-goose
发布于 2014-01-12 19:15:17
来自他们的文件
Goose将尝试提取以下信息:
他们不保证获得作者;您需要查看元数据,以查看它是否包含并手动提取它。
发布于 2015-08-18 18:57:13
报纸可以满足你的要求。
这是usage:>>> article.authors u‘’Leigh Caldwell','John‘
您可以从它的文档或Github中找到更多的细节。http://newspaper.readthedocs.org/en/latest/
这是相当简单和强大的。
https://stackoverflow.com/questions/21079015
复制相似问题