使用文本排序算法进行摘要比使用BERT摘要有什么优点?即使这两种方法都可以作为抽取摘要的方法,但对于文本排名是否有什么特别的优势?
发布于 2020-07-05 16:57:20
TextRank实现往往是轻量级的,即使在内存资源有限的情况下也可以快速运行,而转换模型(如伯特 )往往相当大,需要大量内存。虽然TinyML社区在使DL模型在有限的资源范围内运行的技术方面做了出色的工作,但对于某些用例来说,可能有资源优势。
一些TextRank实现可以通过添加语义关系来“定向”,人们可以把语义关系看作是一种先验结构,以丰富所使用的图形--或者在某些情况下是结合人工循环方法的方法。这些可以提供优势的监督学习模型,已培训纯粹的数据。尽管如此,一般DL也有类似的努力(例如,转移学习主题的变化),变压器可能从中受益。
另一个潜在的好处是,TextRank方法往往更透明,而变压器模型在可解释性方面可能具有挑战性。有些工具非常有用,但在模型偏差和公平性、数据伦理、法规遵从性等方面,这种关注变得非常重要。
根据个人经验,虽然我是流行的TextRank 开源实现的主要提交者,但我只对需要“廉价和快速”解决方案的用例使用它的抽象摘要特性。否则,我建议考虑更复杂的总结方法。例如,我建议密切关注“TextRank,拉达Mihalcea”的作者和她在密歇根大学的研究生们正在进行的研究。
关于比较,“哪种文本摘要方法工作得更好?”,我想指出的是关于抽象摘要的工作,特别是John Bohannon,等人。最近在入门上的工作。对于优秀的例子,请查看他们的团队使用自然语言理解、知识图表、抽象摘要等生成的“每日简报” of CV19研究。
https://stackoverflow.com/questions/62731497
复制相似问题