首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用Pythons Wikipedia提取多个Wikipedia页面

使用Pythons Wikipedia提取多个Wikipedia页面
EN

Stack Overflow用户
提问于 2021-06-15 12:50:40
回答 1查看 90关注 0票数 1

我不知道如何使用Pythons维基百科插件从搜索结果中提取多个页面。请给我一些建议。

到目前为止我的代码是:

代码语言:javascript
复制
import wikipedia as wiki
import pprint as pp
from transformers import BertTokenizer, BertForSequenceClassification

model = BertForSequenceClassification.from_pretrained('bert-base-uncased')
question = 'New Zealand'
tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
results = wiki.search(question)
print("Wikipedia search results for our question:\n")
pp.pprint(results)

page = wiki.page(results[0])
text = page.content

如何让page保存所有不同的搜索结果?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-06-15 13:10:30

您已经完成了困难的部分,结果已经在results变量中了。

但是结果需要由wiki.page()方法进行解析,它只需要一个参数。

解决方案是什么?使用循环逐一解析所有结果。

最简单的方法是用于循环,但列表理解方法是最好的。

将最后两行改为:

代码语言:javascript
复制
text = [wiki.page(i).content for i in results]

您应该获得text变量中的所有文本,这是一个列表。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/67986624

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档