我正在寻找专门用于练习机器学习和NLP的保险数据集,但在kaggle、udemy或其他网站上找不到很多。是否有办法获取数据集或任何存储此数据集的网站。
我主要是寻找NLP实践自动索赔生成或其他保险活动,请建议的做法。
发布于 2020-06-09 10:41:33
我在同一行业工作了几年,我可以告诉您,由于文档的性质,没有公开可用的数据集。它们非常私密,包含敏感信息,这些信息受规则和条例的约束。
发布于 2020-06-09 20:25:16
当数据集在NLP情况下不可用时,我遵循的方法之一是使用基于模板的方法生成数据集。实现如下所示
cities = ['paris', 'munich', 'new york']
days = ['monday', 'tuesday', 'sunday', 'friday']
templates = ['i am flying from {cities} to {cities}',
'my flight is arriving in {cities} on next {days}']因此,现在编写一个脚本来帮助您填充模板中存在的这些缺失的值。
https://datascience.stackexchange.com/questions/75648
复制相似问题