搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏新智元
何恺明等最新论文：实例分割全新方法TensorMask，效果比肩 Mask R-CNN
TensorMask：将实例分割视为4D张量预测在密集、规则的网格上生成边界框对象预测的滑动窗口目标检测器 (sliding-window object detectors) 已经得到迅速发展，并得到了广泛的应用在这项工作中，我们研究了密集滑动窗口实例分割 (dense sliding-window instance segmentation) 的范例，令人惊讶的是，这方面的研究十分不足。弥补差距：实例分割中的密集方法滑动窗口 (sliding-window) 范例 —— 通过查看放置在一组密集图像位置上的每个窗口来查找对象 —— 是计算机视觉中最早、也是最成功的概念之一，并且这个概念自然地与卷及网络相关结论 TensorMask 是一个 dense sliding-window 实例分割框架，首次在定性和定量上都接近于 Mask R-CNN 框架。
1K20发布于 2019-05-08
来自专栏人工智能LeadAI
R-CNN目标检测第三弹（Faster R-CNN）
因此，对每个(n,n)子窗口，paper在提出采用旋转不变的 Anchors：在每一个 sliding-window location，同时预测 k 个 region proposals，这样一来，分类层会输出这里的k个anchor是一些以sliding-window的中心为中心，不同scale和aspect ratio的proposal。这里取3种scale和3种aspect-ratio，那么k=9。假设conv feature map的大小为 (W,H)，那么anchors的个数为 WHK，这是因为在有边界padding的情况下，每个点都是sliding-window location。
1.1K80发布于 2018-03-09
来自专栏媒矿工厂
Efficient Contextformer：利用空间通道窗口注意力机制实现可学习图像压缩中的快速上下文建模
对latent的划分：将通道划分成 _{} 段，一幅图像共有 ××_{} 个序列对于这些序列有两种处理方式：空间优先（sfo）、通道优先（cfo），如下图所示：图 2 为降低复杂度，使用3D sliding-window patch-wise+channel-wise 图 4 参数设置：训练图像大小：256x256（latent tensor：16x16） Spatial kernel size ：16、8（ 3D sliding-window
1K10编辑于 2024-06-14
来自专栏机器学习、深度学习
目标检测--Light-Head R-CNN: In Defense of Two-Stage Object Detector
RPN (Region Proposal Network) is a sliding-window class-agnostic object detector that use features from
1.3K90发布于 2018-01-03
来自专栏大数据成神之路
8-Flink中的窗口
flink支持窗口的两个重要属性（size和interval）如果size=interval,那么就会形成tumbling-window(无重叠数据) 如果size>interval,那么就会形成sliding-window
1.9K20发布于 2019-03-05
来自专栏深度学习自然语言处理
YOCO：全新Decoder-Decoder架构，内容减少6倍，推理速度提升30倍
自解码器: 使用高效的自注意力机制，如滑动窗口注意力（sliding-window attention）。交叉解码器: 使用全局交叉注意力来关注自解码器输出的共享KV缓存。
91810编辑于 2024-05-29
来自专栏量子位
何恺明、陈鑫磊最新研究：提出实例分割新方法TensorMask，效果比肩Mask R-CNN
但是，密集滑动窗口的实例分割 (Dense Sliding-window Instance Segmentation)却鲜少被人关注。
1.3K40发布于 2019-04-22
来自专栏Lansonli技术博客
2021年大数据Flink（十八）：Flink Window操作
size分类窗口有两个重要的属性: 窗口大小size和滑动间隔slide,根据它们的大小关系可分为: tumbling-window:滚动窗口:size=slide,如:每隔10s统计最近10s的数据 sliding-window
1.1K10发布于 2021-10-11
突破无限时长！StableAvatar革命性框架获音频本质建模能力，数字人视频生成迎重大突破
动态加权滑动窗口策略（Dynamic Weighted Sliding-window Strategy）：用于在时间维度上平滑融合潜在特征，提高长视频的连续性和平滑度。动态加权滑动窗口策略为了提升合成长头像视频的平滑度，在推理过程中进一步提出了一种动态加权滑动窗口策略（Dynamic Weighted Sliding-Window Strategy，DWSW）。可以看到，motion frame 和传统的 sliding-window 方法都无法消除视频片段连接处引起的抖动。
70820编辑于 2025-08-27
6倍极速生成无限时长人像视频！复旦&微软最新FlashPortrait:让你成为数字人面具背后的TA
加权滑窗策略（Weighted Sliding-Window Strategy）将长视频划分为多个重叠窗口，窗口重叠长度设为v(v=5)，确保相邻窗口存在部分共享帧，在重叠区域采用算术插值权重，对相邻窗口的潜变量进行加权融合
36310编辑于 2025-12-25
来自专栏OpenMMLab
MMEditing | 新视频超分算法冠军BasicVSR++来了
跟 sliding-window 方法相比, BasicVSR++ 能在更少参数量下达到更优秀的效果。例如, BasicVSR++ 只需要EDVR 35%的参数量便能大幅度超越 EDVR。
1.9K21编辑于 2022-01-17
来自专栏计算机工具
流水线传输协议；回退N步GBN（滑动窗口协议）；选择重传SR，
因此，N 常被称为窗口长度（window size），GBN 协议也常被称为滑动窗口协议（sliding-window protocol）。
1.2K10编辑于 2024-12-16
来自专栏机器之心
你能永远陪我聊天吗？复旦&微软提出StableAvatar: 首个端到端无限时长音频驱动的人类视频生成新框架!
Dynamic Weighted Sliding-Window Strategy 与先前的滑窗去噪策略相比，我们在相邻窗口的重叠潜变量上引入了滑动融合机制，其中融合权重依据相对帧索引采用对数插值分布。
82010编辑于 2025-09-02
来自专栏SnailTyan
U-Net - Convolutional Networks 论文翻译——中英文对照
such a network can be trained end-to-end from very few images and outperforms the prior best method (a sliding-window Hence, Ciresan et al. [1] trained a network in a sliding-window setup to predict the class label of each This is significantly better than the sliding-window convolutional network result by Ciresan et al. ,
5.6K51发布于 2020-04-24
来自专栏CVer
一文看尽21篇目标检测最新论文（腾讯/Google/商汤/旷视/清华/浙大/CMU/华科/中科院等）
---- 【19】TensorMask: A Foundation for Dense Object Segmentation Sliding-window object detectors that In this work, we investigate the paradigm of dense sliding-window instance segmentation, which is surprisingly
2.1K20发布于 2019-05-05
来自专栏大数据解决方案
彻底搞清 Flink 中的 Window 机制
size分类窗口有两个重要的属性: 窗口大小size和滑动间隔slide,根据它们的大小关系可分为: tumbling-window:滚动窗口:size=slide,如:每隔10s统计最近10s的数据 sliding-window
1.5K40发布于 2021-11-04
来自专栏机器之心
滑动窗口也能用于实例分割，陈鑫磊、何恺明等人提出图像分割新范式
为什么需要 TensorMask 滑动窗口范式（sliding-window paradigm）是计算机视觉领域最早、最成功的概念之一，这种技术通过查看一组密集图像上的每个窗口来寻找目标，和卷积神经网络产生了自然的关联
1.4K10发布于 2019-04-29
来自专栏人工智能前沿讲习
前沿 | Kaiming He和Ross Girshick大神最新力作TensorMask深入解读
在这篇工作中，我们研究了一种基于密集滑窗的实例分割（dense sliding-window instance segmentation）的实例。
1.4K52发布于 2020-05-11
来自专栏半杯茶的小酒杯
目标检测-Training with Online Hard Example Mining
在sliding-window object detectors(如deformable parts model,DPM)中，负正样本比例大约在10000:1；在object-proposal-based
58230编辑于 2022-04-28
来自专栏OpenMMLab
零基础 Pytorch 入门超分辨率
早期比较流行的方法一般都是采取一个滑动窗口 (sliding-window) 的框架。在这个框架中，我们会使用 {k±i | i=0，1，2，⋯} 视频帧来复原第k个视频帧。
1.3K33编辑于 2022-01-18

第 2 页第 3 页

点击加载更多

何恺明等最新论文：实例分割全新方法TensorMask，效果比肩 Mask R-CNN

R-CNN目标检测第三弹（Faster R-CNN）

Efficient Contextformer：利用空间通道窗口注意力机制实现可学习图像压缩中的快速上下文建模

目标检测--Light-Head R-CNN: In Defense of Two-Stage Object Detector

8-Flink中的窗口

YOCO：全新Decoder-Decoder架构，内容减少6倍，推理速度提升30倍

何恺明、陈鑫磊最新研究：提出实例分割新方法TensorMask，效果比肩Mask R-CNN

2021年大数据Flink（十八）：Flink Window操作

突破无限时长！StableAvatar革命性框架获音频本质建模能力，数字人视频生成迎重大突破

6倍极速生成无限时长人像视频！复旦&微软最新FlashPortrait:让你成为数字人面具背后的TA

MMEditing | 新视频超分算法冠军BasicVSR++来了

流水线传输协议；回退N步GBN（滑动窗口协议）；选择重传SR，

你能永远陪我聊天吗？复旦&微软提出StableAvatar: 首个端到端无限时长音频驱动的人类视频生成新框架!

U-Net - Convolutional Networks 论文翻译——中英文对照

一文看尽21篇目标检测最新论文（腾讯/Google/商汤/旷视/清华/浙大/CMU/华科/中科院等）

彻底搞清 Flink 中的 Window 机制

滑动窗口也能用于实例分割，陈鑫磊、何恺明等人提出图像分割新范式

前沿 | Kaiming He和Ross Girshick大神最新力作TensorMask深入解读

目标检测-Training with Online Hard Example Mining

零基础 Pytorch 入门超分辨率

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐