他们简单地构建了一个CRNN网络,结合CNN和RNN,制作了一个区分足球比赛和电视广告的视频分类器。
我的问题是对输入视频中是否包含作弊行为(考试作弊)进行分类或简单判断,因此根据本教程,我应该通过一组欺骗和非欺骗图像来训练CNN,然后通过这个网络传递一系列帧以输出一系列(骗子/非作弊者)标志,最后用该输出来训练或测试RNN。
在这种情况下,CNN也会表现出色,因为我会利用自己和我的团队扮演骗子和不作弊者的角色,得到一个庞大的数据集来训练CNN,这意味着同一个人会扮演骗子和非骗子的角色,这可能会导致混乱!
我的最后一个问题是,我是否可以使用本教程中声明的行为分类方法?或者CNN能成功地区分欺骗和非欺骗帧吗?
发布于 2017-02-23 00:30:28
实际上,使用相同的人为骗子和非作弊者剪辑将改善培训。网络必须学会根据行为而不是欺骗者的身体特征进行区分。
我希望这对你会有很好的效果。但是,根据特定行为,您可能需要使用视频序列而不是单个帧来描述某些行为。有时,欺骗由一系列请求和响应组成,而不是包含在单个帧中的数据。
这有用吗?
https://stackoverflow.com/questions/42404697
复制相似问题