首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >美丽的汤,抓取没有常量/定义类或id的信息

美丽的汤,抓取没有常量/定义类或id的信息
EN

Stack Overflow用户
提问于 2021-06-07 23:58:09
回答 1查看 43关注 0票数 0

我正在从谷歌专利中抓取信息,目前我正试图从每一项专利中抓取“发明领域”部分。然而,当检查html时,它似乎没有自己的"field“类或id来允许我获取信息,所以我不确定我如何能够获得我需要的描述。例如,考虑到这项专利:https://patents.google.com/patent/EP3017304B1/en,我不确定如何从“发明的技术领域”中抓取信息。

一些专利的发明领域可能在不同的地方,比如这个:https://patents.google.com/patent/US8560271B2/en,它甚至只被贴上了“领域”的标签。一些专利可能根本不包含发明领域,或者它们可能被贴上标签或放在不易找到的地方,比如这一项:https://patents.google.com/patent/AU2016304408B2/en

因此,我不确定我如何能够持续地从专利页面中剔除发明领域

EN

回答 1

Stack Overflow用户

发布于 2021-06-08 04:16:41

您可以这样做:

代码语言:javascript
复制
container = soup.find('ul', {'mxw-id': 'PDES120175635'}).find('div', {'num': '0001'}).string

从“本发明的技术领域”获取文本。其他的也有一个唯一的数字。使用inspect控制台。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/67874930

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档