我正在寻找命名实体标注语料库的英语新闻领域在文本和语音(转录)在同一时间段。如果任何人有任何关于语料库的信息,请给我发送链接。
谢谢卡达卡
发布于 2012-07-18 08:02:04
我发现Open American National Corpus非常有用。他们确实提供了包含新闻文本和转录语音的named-entity tagged portion,但请注意,它是使用BBN NE标签器标记的,而不是一大群人。不过,我在使用这种语料库引导其他模型时取得了不错的结果。
祝你好运。我很想知道你的结果。
https://stackoverflow.com/questions/10674418
复制相似问题