首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用python进行Tripadvisor web抓取

使用python进行Tripadvisor web抓取
EN

Stack Overflow用户
提问于 2017-07-03 21:39:54
回答 1查看 349关注 0票数 0

我使用以下代码从一个使用python的url中提取评论,但是导出的csv在一个列中并不包含所有评论。相反,它将数据导出到不同的列中。我是否必须在现有代码的基础上添加任何代码?

代码语言:javascript
复制
import requests
from unidecode import unidecode
from bs4 import BeautifulSoup
URL = "https://www.tripadvisor.in/Hotel_Review-g295424-d1735662-Reviews-
Winchester_Grand_Hotel_Apartments-Dubai_Emirate_of_Dubai/"
r = requests.get(URL)
soup = BeautifulSoup(r.content, 'html5lib')

resultsoup = soup.find_all("p", {"class" : "partial_entry"})

with open('testreview.csv', 'w') as fid:
   for review in resultsoup:
      review_list = review.get_text()
      fid.write(unidecode(review_list))
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-07-06 19:13:13

您所需要做的可能就是在要写入文件的行中添加一个新行字符('\n')。

您所需要做的可能就是在要写入文件的行中添加一个新行字符('\n')。

代码语言:javascript
复制
with open('testreview.csv', 'w') as fid: 
    for review in resultsoup: 
        review_list = review.get_text()
        fid.write(unidecode(review_list+'\n'))
票数 -1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/44887053

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档