表 1:模型不同模块效果 为了验证模型的扩展性,作者也在表情识别数据集上做了实验,,并在 youtube-8 数据集上取得了目前最高的精度。 youtube-8 dataset 包括 1101 个视频,分为 8 种表情。
事实上,kaggle已经与谷歌云一道,主办了最大的视频理解竞赛,称为YouTube-8百万视频理解挑战。