首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >需要为大型语料库应用基于规则的算法来查找元素数组中存在的相似/相关关键字

需要为大型语料库应用基于规则的算法来查找元素数组中存在的相似/相关关键字
EN

Stack Overflow用户
提问于 2021-12-30 13:47:53
回答 1查看 37关注 0票数 0

目前正在NLP工作空间中各自处理文本数据。我想通过基于搜索的方式找出基于列的实际给定的基于关键字的领域字典。

代码语言:javascript
复制
developer_position=['software engineer','florida','highest pay','startups']
analyst_position=['qa', 'testing','plsql']
data_science_position=['analytics lead','lead','python','R']
architect_position=['mongodb','technical architect','sql','java','kafka']
manager_position=['pmp certified','sixsigma', 'belt','delivery manager']

corpus=["software engineer positions are high demand in California",
   "qa average salary in USA is $120K-$150K",
   "Django & reactjs are minimum requirements for lead positions"]

输出应根据每个类别中的高概率关键字预测哪个类别位置将落入特定行

EN

回答 1

Stack Overflow用户

发布于 2021-12-30 15:48:05

您可以在Python中使用基于spaCy规则的匹配,也可以在Javascript中使用winkNLP自定义实体coreNLP的令牌正则表达式。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/70532525

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档