首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >LSTM文本生成

LSTM文本生成
EN

Data Science用户
提问于 2017-07-14 06:05:29
回答 1查看 635关注 0票数 1

我在网上找到的关于LSTMs的大多数例子都提到了“随机”文本生成。我试图解决的问题之一是将许多文档生成一个“摘要”到一个文档中。例如:

  • 新闻文章:巴拉克·奥巴马的生活史(2K字)
  • 维基百科:巴拉克·奥巴马(10K字)
  • 巴拉克·奥巴马传记(10K字)

会用X字写一篇关于奥巴马的文章。

LSTM是正确的方法吗?

EN

回答 1

Data Science用户

回答已采纳

发布于 2017-07-14 09:29:18

虽然您可以以这种方式生成文本--从RNN中抽取样本来预测下一个字符或单词--但这是没有意义的。最好是语法上准确的(名词、动词、形容词等),但语义上是无稽之谈。这不是一个总结,除非是幸运的意外。

要直接使用LSTM生成摘要,您需要使用实际的摘要输入和输出示例来培训网络。这将是类似于机器翻译的任务,但由于输入的大小的变化,难度要大得多。您不太可能找到足够的培训数据来全面测试这一想法,而且即使有大量的培训数据,也不清楚这样一种直接的方法是否能产生可接受的结果。

事实上,文字摘要绝不是一个解决问题的方法。有一些深入学习的方法,如谷歌大脑团队利用TensorFlow的努力,您可以学习这些方法来获得一些示例代码和一种最先进的感觉。这种方法使用一种注意力模型来提取明显的信息内容(即某些假定的通用文件中出现的可能性很低的内容,因此由于突出而被假定是有趣的)。使用经过训练的LSTM来建立这样一个基于注意力的模型是可能的--直觉是,已经受过训练的LSTM最不可能预测的文档中的部分可能包含值得注意的信息。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/20418

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档