我的数据集由来自不同网站的视频游戏标题组成,以不同的方式格式化。下面是我的例子:
"The Legend Of Zelda: Wind Waker, Nintendo"
"The Legend Of Zelda: The Wind Waker"
"The Legend Of Zelda: Wind Waker, Nintendo"
"The Legend Of Zelda: Wind Waker, Nintendo"
"Zelda: Wind Waker Hd Nintendo Wii U Game"
"The Legend Of Zelda: The Wind Waker"
"Legend Of Zelda: The Wind Waker Hd (nintendo Wii"
"The Legend Of Zelda: Wind Waker Of Game (nintendo"
"The Legend Of Zelda: The Wind Waker Nintendo Wii"
"Nintendo Wii U Game Zelda: Wind Waker Hd"
"The Legend Of Zelda: The Wind Waker Hd Wii U"
"The Legend Of Zelda: Wind Waker, Nintendo Pinterest"
"Zelda: Hd (nintendo Wii The"
"The Legend Of Zelda: The Wind Waker Hd Wii U Pinterest"
"The Legend Of Zelda: The Wind Waker Hd"
"Legend Of Zelda: Wind Waker Hd (nintendo Wii"
"The Legend Of Zelda: The Wind Waker Hd"
"The Legend Of Zelda: Wind Waker, Nintendo Wii U"
"The Legend Of Zelda Wind Hd"
"Zelda Wind Waker Hd"
"The Legend Of Zelda: Wind Waker, Nintendo Pinterest"
"The Legend Of Zelda Wind Waker Wii U Nintendo"
"Wii U The Legend Of Zelda: The Wind Waker Hd"
"Zelda: Wind Waker Hd"
"The Legend Of Zelda: The Wind Waker Hd Game Wii"
"The Legend Of Zelda: The Wind Waker Hd Nintendo Wii U"
"Zelda: Wind Waker Hd"
"The Legend Of Zelda The Wind Waker Hd Wii U"此数据的正确输出为:
The Legend Of Zelda: The Wind Waker HD -标题
Wii U -平台
Nintendo - Publisher
我可以给这些数据集的100个模型提供我期望的正确输出,然后希望该模型为未来的标题数据集“学习”预期输出可能是什么。
这是机器学习可以做到的吗?我应该使用什么型号?我以前从来没有用ML做过任何事情,所以我不确定这是不是一个很好的用例。
发布于 2020-11-09 05:55:54
正如我在您的问题中看到的,标题、平台和出版商(输出)是从原始数据(输入)中提取的,因此您可以使用类似于命名实体识别的东西,您应该查看文献以了解更多信息,但这是最有可能的方向。
https://stackoverflow.com/questions/64743203
复制相似问题