这个问题类似于视频对象分割，其中需要通过利用跨帧的时间信息在视频中跨多个帧对对象进行语义分割。在您的例子中，每组输入图像可以被认为是一个包含20帧的视频，数据集包含50个视频，您可以使用监督、半监督或无监督视频对象分割模型(取决于获得地面真实掩码的可用性/成本)。这个公式解决了使用FCN以(x,y,t)顺序分割输入图像堆栈的任务。

以下是我找到的与视频对象分割相关的研究工作的参考资料：

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/59505174

复制

相似问题

问用于3d分割的深度学习
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问用于3d分割的深度学习EN