首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >数据集-用于文本处理的样例pdfs?

数据集-用于文本处理的样例pdfs?
EN

Data Science用户
提问于 2017-07-25 12:26:32
回答 1查看 4.1K关注 0票数 1

我正在寻找一个相当多的pdf文件测试我的文本处理程序。试图寻找一个开放的网站,以获得像数千个pdfs,但未能找到任何东西。我真的不知道这是不是合适的地方问(可能不是),但也许有人给我一个很好的提示。

提前谢谢。

EN

回答 1

Data Science用户

回答已采纳

发布于 2017-07-25 18:14:45

具有~1,000 pdfs的GitHub回购程序是这里

另一个GitHub回购有一个包括边缘箱在内的pdf例子的语料库是这里

票数 4
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/21679

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档