文章/答案/技术大牛

发布

社区首页 >问答首页 >使用python的beautifulSoup库从IMDB网站抓取影评

问使用python的beautifulSoup库从IMDB网站抓取影评
EN

Stack Overflow用户

提问于 2021-06-11 12:02:13

回答 1查看 238关注 0票数 0

我想从IMDB网站上抓取某部电影的所有评论。我已经使用了BeautifulSoup包的'Html-parser‘来做同样的事情。

Link

考虑这个链接，我想要抓取这部电影的所有评论(即Total = 69)，但由于在页面上可以看到25条评论，Soup将只提取25条评论，而不是这里的总评论。

我的代码：

url = "https://www.imdb.com/title/tt6654210/reviews?ref_=tt_ov_rt"
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
review_list = getReviewsList(soup)
len(review_list)

输出：

我是网络刮擦的新手，如果有人能帮我做同样的事，我将不胜感激。

web-scraping

beautifulsoup

imdb

python

回答 1

Stack Overflow用户

发布于 2021-06-11 12:28:35

如果你想对一个页面进行抓取，首先你必须了解它是如何工作的，使用开发工具检查并分析网络调用，然后你必须模拟你需要的调用。

在本例中，页面使用ajax以分页的方式获得评论

你必须打电话给：

https://www.imdb.com/title/tt6654210/reviews/_ajax?ref_=undefined&paginationKey=g4wp7dreqyzd4zql7kvh3obyrtum6az4y4hhzo5ziwr26fbyhvrl4ty4o4yvzmjkcrxndtvd7hmf6y6yefcmwoi6hkwovare

分页密钥在页面中由以下标签提供：

<div class="load-more-data" data-key="g4wp7dreqyzd4zql7kvh3obyrtum6az4y4hhzo5ziwr26fbyhvrl4ty4o4yvzmjkcrxndtvd7hmf6y6yefcmwoi6hkwovare" data-ajaxurl="/title/tt6654210/reviews/_ajax">

我希望我能帮上忙

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/67931115

复制

相似问题

问使用python的beautifulSoup库从IMDB网站抓取影评
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用python的beautifulSoup库从IMDB网站抓取影评EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用python的beautifulSoup库从IMDB网站抓取影评
EN