首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在Map Reduce上实施DBSCAN时需要帮助

在Map Reduce上实施DBSCAN时需要帮助
EN

Stack Overflow用户
提问于 2013-04-07 22:38:23
回答 1查看 1.5K关注 0票数 1

我正在尝试在MR上实现DBSCAN,并使用下面粘贴的链接中的直觉

代码语言:javascript
复制
http://codingwiththomas.blogspot.com/2012/05/distributed-dbscan-intuition.html

Best programming language to implement DBSCAN algorithm querying a MongoDB database?

我的问题是如何计算初始距离矩阵。我不想仅仅为了计算距离矩阵而运行hadoop作业,并将其存储在内存中,因为我不会是一个好的设计。有什么建议吗。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2013-04-07 22:50:28

感谢你阅读我的博客。

是的,计算距离矩阵是非常困难的。

我应用了minhash聚类(mahout也有一个实现)来查找非常相似的向量。所以你不必计算整个距离矩阵,而是计算相似向量的距离矩阵。

因此,我对您的建议是使用mahout的minhashing来查找相似向量的集群。然后为它们计算一个较小的距离矩阵,然后应用我在帖子中写的其余要点:

  • 从你的“迷你”集群中提取邻接点
  • 从结果图中运行连通分量算法(有MapReduce,Giraph和Hama的实现)

所以基本上就是这样了。不幸的是,不能开放整个阶段的源代码,所以这就是整个过程所需要的。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/15863566

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档