首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用bs4翻译页面后对其进行抓取

使用bs4翻译页面后对其进行抓取
EN

Stack Overflow用户
提问于 2018-09-26 19:42:34
回答 1查看 765关注 0票数 0

我试图通过转换成英语来抓取一个在法国的页面。

这是我的代码,使用了漂亮的汤和用python编写的请求包。

代码语言:javascript
复制
import requests
from bs4 import BeautifulSoup
url = '<url>'
headers = {"Accept-Language": "en,en-gb;q=0.5"}
r = requests.get(url, headers=headers)
c = r.content
soup = BeautifulSoup(c)

但这仍然是给出了法语文本。

有没有人能建议修改/替代代码。

EN

回答 1

Stack Overflow用户

发布于 2018-09-26 20:05:54

您可以利用TextBlob将字符串转换为各种语言,这是一个从法国易趣站点转换跨度的示例:

代码语言:javascript
复制
import requests
from bs4 import BeautifulSoup
from textblob import TextBlob

url = 'https://www.ebay.fr/'
french = []
english = []
r = requests.get(url)
c = r.content
soup = BeautifulSoup(c)
for li in soup.find_all('span'):
    french.append(li.text)

Frenchstr = ''.join(french)
blob = TextBlob(Frenchstr)
print(Frenchstr)
Englishstr = blob.translate(to="EN")
print('------------------------------------------------')
print(Englishstr)
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/52516934

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档