首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何通过无监督方法学习数据到文本NLG中的语义对齐?

如何通过无监督方法学习数据到文本NLG中的语义对齐?
EN

Stack Overflow用户
提问于 2020-08-14 15:05:21
回答 1查看 67关注 0票数 0

我是数据到文本NLG的新手。我正在研究数据到文本的语义对齐,任务定义是用数据表的键标记关于数据故事的参考文本片段,如下图所示。

data-to-text

现在的困难是没有标记的数据,所以我不知道如何处理它。所以我想知道有没有关于这个问题的论文或方法。谢谢!

EN

回答 1

Stack Overflow用户

发布于 2020-10-01 17:14:06

这就是文本的词性标注,称为词性标注模型(- of -)。你应该从spaCy开始,下面是理解它的代码:

代码语言:javascript
复制
import spacy

nlp = spacy.load("en_core_web_sm")
doc = nlp("Apple is looking at buying U.K. startup for $1 billion")

for token in doc:
    print(token.text, token.lemma_, token.pos_, token.tag_, token.dep_,
            token.shape_, token.is_alpha, token.is_stop)

输出将为:

代码语言:javascript
复制
Apple Apple PROPN NNP nsubj Xxxxx True False
is be AUX VBZ aux xx True True
looking look VERB VBG ROOT xxxx True False
at at ADP IN prep xx True True
buying buy VERB VBG pcomp xxxx True False
U.K. U.K. PROPN NNP compound X.X. False False
startup startup NOUN NN dobj xxxx True False
for for ADP IN prep xxx True True
$ $ SYM $ quantmod $ False False
1 1 NUM CD compound d False False
billion billion NUM CD pobj xxxx True False

有关详细了解,请访问https://spacy.io/usage/linguistic-features

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/63408064

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档