我用来自http://www.manythings.org/anki/的葡萄牙语-英语数据集训练了一个变形金刚。这是一个并行的句子数据集。
训练结束后,我试着把"doente“这个词翻译成”病“,但我却得到了”我觉得不舒服“。
你知道我怎么才能让这个词恶心吗?
我在用错误的数据集训练我的模型吗?句子为基础而不是文字为基础?
tks预先
发布于 2021-12-14 10:03:21
机器翻译一般在句子上工作,因为一个词的使用背景改变了它的意思。逐字翻译是没有意义的.
所以会发生的是,你的单词缓和通常发生在英语翻译为“我感到恶心”的句子中,这是最低限度的语境。因为这些都只是机器的字符,所以从人类的角度来看,没有人‘理解’只有sick部分对应于缓和。
如果你想翻译单词,请使用双语词典;我怀疑这方面是否存在基于单词的模式,因为数十年的机器翻译研究表明,你需要更多的语言来翻译,而不仅仅是文字。
https://stackoverflow.com/questions/70339341
复制相似问题