我有一些英语文本已经被标记了。例如,文本标记的长度约为20000,并且每个单词(tokenize)都有一个索引。此外,每个索引都有一个标签,作为标记为'b‘的句子中的起始词,在标记为'e’的句子中作为结束词(包括符号),而其他单词则标记为'o‘。有标记的训练数据和未标记的测试数据。
我的问题是:我们如何使用机器学习方法或深度学习模型来解决测试数据中单词标签的预测问题?我的意思是,我们如何使培训的标签和数据只是一个词的培训?我很困惑。
发布于 2019-05-07 06:49:16
https://datascience.stackexchange.com/questions/51367
复制相似问题