我是NLP的新手,我有一堆原始数据,在所有的医学问题上都没有标注,我需要从这些问题中提取出哪些健康问题。
我在想,我需要为NER创建两个定制POS标记:
-the在身体上的位置
-the问题本身
因此,如果有人问“我的头疼”,它会明白位置是头部,问题是它疼,但如果有人问‘我的皮肤在我的腹部周围红色’,它就会明白位置是腹部,问题是皮肤是红色的。
在提取这些数据之后,我需要根据用户要求的内容推荐医学文章。
我有一些问题:
1.我是否走在正确的道路上?
2.你将如何实施?
3.对于位置和健康问题,我是否需要一个自定义的pos标签,还是可以更容易地完成?你怎么提取这些信息的?
4.我想我必须手动标记问题,对吗?
5.你将采用什么框架?
6.要建立推荐系统,我需要从医学文章中提取同样的信息?
7.您将如何创建推荐系统?
正如我说的,我对NLP还不熟悉,我还没有决定框架,但问题不是英语,但是我在github上发现了一个WordNet克隆和一个命名的实体语料库,所以在推荐框架时请记住。
发布于 2021-05-13 10:09:52
几点意见:
https://datascience.stackexchange.com/questions/94375
复制相似问题