首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >合并/比给定半径更接近的平均邻居

合并/比给定半径更接近的平均邻居
EN

Stack Overflow用户
提问于 2018-05-10 14:02:51
回答 1查看 593关注 0票数 2

我有一个三维空间中的几百个坐标,我需要把比给定半径更近的点合并起来,用邻居平均值来代替它们。

这听起来是一个相当标准的问题,但到目前为止我还没有找到解决办法。数据集足够小,能够计算所有点的成对距离。

不知道,也许是稀疏距离矩阵上的某种图分析/连通成分标记?

我真的不需要平均部分,只需要聚类(聚类是正确的术语吗?)

玩具数据集可以是coords = np.random.random(size=(100,2))

以下是我到目前为止使用scipy.cluster.hierarchy所做的尝试。这似乎很好,但我愿意接受更多的建议(也许是DBSCAN?)

代码语言:javascript
复制
import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt

from scipy.cluster.hierarchy import fclusterdata
from scipy.spatial.distance import pdist

np.random.seed(0)

fig = plt.figure(figsize=(10,5))

gs = mpl.gridspec.GridSpec(1,2)
gs.update(wspace=0.01, hspace= 0.05)

coords = np.random.randint(30, size=(200,2))
img = np.zeros((30,30))
img[coords.T.tolist()] = 1

ax = plt.subplot(gs[0])
ax.imshow(img, cmap="nipy_spectral")

clusters = fclusterdata(coords, 2, criterion="distance", metric="euclidean")
print(len(np.unique(clusters)))

img[coords.T.tolist()] = clusters

ax = plt.subplot(gs[1])
ax.imshow(img, cmap="nipy_spectral")

plt.show()

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-05-10 16:46:06

下面是一种使用KDTree查询邻居和networkx模块来收集连接组件的方法。

代码语言:javascript
复制
from scipy import spatial
import networkx as nx

cutoff = 2

components = nx.connected_components(
    nx.from_edgelist(
        (i, j) for i, js in enumerate(
            spatial.KDTree(coords).query_ball_point(coords, cutoff)
        )
        for j in js
    )
)

clusters = {j: i for i, js in enumerate(components) for j in js}

示例输出:

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/50274753

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档