我是数据到文本NLG的新手。我正在研究数据到文本的语义对齐,任务定义是用数据表的键标记关于数据故事的参考文本片段,如下图所示。
现在的困难是没有标记的数据,所以我不知道如何处理它。所以我想知道有没有关于这个问题的论文或方法。谢谢!
发布于 2020-10-01 17:14:06
这就是文本的词性标注,称为词性标注模型(- of -)。你应该从spaCy开始,下面是理解它的代码:
import spacy
nlp = spacy.load("en_core_web_sm")
doc = nlp("Apple is looking at buying U.K. startup for $1 billion")
for token in doc:
print(token.text, token.lemma_, token.pos_, token.tag_, token.dep_,
token.shape_, token.is_alpha, token.is_stop)输出将为:
Apple Apple PROPN NNP nsubj Xxxxx True False
is be AUX VBZ aux xx True True
looking look VERB VBG ROOT xxxx True False
at at ADP IN prep xx True True
buying buy VERB VBG pcomp xxxx True False
U.K. U.K. PROPN NNP compound X.X. False False
startup startup NOUN NN dobj xxxx True False
for for ADP IN prep xxx True True
$ $ SYM $ quantmod $ False False
1 1 NUM CD compound d False False
billion billion NUM CD pobj xxxx True Falsehttps://stackoverflow.com/questions/63408064
复制相似问题