我想建立一个聊天机器人,主要是伯特(变压器),以德语为基础。但我没有找到任何德国聊天机器人的数据集!
那么,使用将英语数据集翻译成德语,然后对模型进行培训是否有意义呢?
知道我能在哪里找到德国数据集或者解决这个问题吗?
发布于 2020-05-30 11:12:48
首先从聊天机器人开始,首先决定您要构建的是哪种类型的聊天机器人。
两者都需要不同的方法来解决问题。
订货机器人对于不同的任务需要多个模型,如意图识别、命名实体识别、状态机等。
聊天机器人只需要2个人对话数据集,在kaggle.com上很容易获得。
但是,如果您正在寻找特定的语言数据集,那么很难在两种类型的机器人中找到它。为此,您可以使用任何您需要支付的翻译api,也可以使用web报废技术免费完成相同的任务。
https://datascience.stackexchange.com/questions/75108
复制相似问题