首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >PyTorch:从一批图像中向量化补丁选择

PyTorch:从一批图像中向量化补丁选择
EN

Stack Overflow用户
提问于 2020-11-19 09:17:21
回答 1查看 93关注 0票数 1

假设我有一批图像作为张量,例如:

代码语言:javascript
复制
images = torch.zeros(64, 3, 1024, 1024)

现在,我想从每个图像中选择一个补丁。所有补丁的大小相同,但批次中每个图像的起始位置不同。

代码语言:javascript
复制
size_x = 100
size_y = 100
start_x = torch.zeros(64)
start_y = torch.zeros(64)

我可以像这样达到预期的结果:

代码语言:javascript
复制
result = []
for i in range(arr.shape[0]):
    result.append(arr[i, :, start_x[i]:start_x[i]+size_x, start_y[i]:start_y[i]+size_y])
result = torch.stack(result, dim=0)

问题是--有没有可能在没有循环的情况下更快地做同样的事情?也许有某种形式的高级索引,或者PyTorch函数可以做到这一点?

EN

回答 1

Stack Overflow用户

发布于 2020-11-19 09:52:29

您可以使用torch.take来消除for循环。但首先,应该使用此函数创建一个索引数组

代码语言:javascript
复制
def convert_inds(img_a,img_b,patch_a,patch_b,start_x,start_y):
    
    all_patches = np.zeros((len(start_x),3,patch_a,patch_b))
    
    patch_src = np.zeros((patch_a,patch_b))
    inds_src = np.arange(patch_b)
    patch_src[:] = inds_src
    for ind,info in enumerate(zip(start_x,start_y)):
        
        x,y = info
        if x + patch_a + 1 > img_a: return False
        if y + patch_b + 1 > img_b: return False
        start_ind = img_b * x + y
        end_ind = img_b * (x + patch_a -1) + y
        col_src = np.linspace(start_ind,end_ind,patch_b)[:,None]
        all_patches[ind,:] = patch_src + col_src
        
    return all_patches.astype(np.int)

正如你所看到的,这个函数本质上是为你想要切片的每个补丁创建索引。使用此函数,可以通过以下方式轻松地解决问题

代码语言:javascript
复制
size_x = 100
size_y = 100
start_x = torch.zeros(64)
start_y = torch.zeros(64)

images = torch.zeros(64, 3, 1024, 1024)
selected_inds = convert_inds(1024,1024,100,100,start_x,start_y)
selected_inds = torch.tensor(selected_inds)
res = torch.take(images,selected_inds)

更新

OP的观察是正确的,上面的方法并不比天真的方法更快。为了避免每次都建立索引,这里有另一个基于unfold的解决方案

首先,构建所有可能的补丁的张量

代码语言:javascript
复制
# create all possible patches
all_patches = images.unfold(2,size_x,1).unfold(3,size_y,1)

然后,从all_patches切片所需的补丁

代码语言:javascript
复制
img_ind = torch.arange(images.shape[0])
selected_patches = all_patches[img_ind,:,start_x,start_y,:,:]
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/64903931

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档