首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何从数据库中提取学术论文的正文

如何从数据库中提取学术论文的正文
EN

Stack Overflow用户
提问于 2020-12-19 18:00:24
回答 1查看 43关注 0票数 0

我想知道我是否可以做出一个从数据库中提取研究论文文本的算法,比如PubMed。

可能,查询语言也是相关的主题。

首先,是否可以使用Python语言编写具有匹配条件的数据库搜索程序,如论文抄袭检查程序?

我认为论文抄袭检查程序给了我很多提示。

其次,这些程序如何搜索文本以检查与输入论文的相似性?

我发现许多研究论文都不是免费的,它们的文本不允许直接搜索。

EN

回答 1

Stack Overflow用户

发布于 2021-01-20 04:56:43

我已经制作了一个名为Findpapers的工具,它对您很有用。它根据关键字从几个数据库(包括PubMed)收集论文。

在收集了论文的PDF之后,我建议您使用Tesseract来提取文本并对其进行任何您喜欢的处理。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/65368592

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档