PostGIS 中的聚类点

发布于 2024-11-16 17:35:25 字数 391 浏览 4 评论 0 原文

我正在构建一个应用程序，从数据库中提取纬度/经度值并将它们绘制在谷歌地图上。可能有数千个数据点，因此我将点“聚集”在一起，这样用户就不会被图标淹没。目前，我在应用程序中执行此聚类，使用如下简单算法：

获取所有点的数组
将第一个点从数组中弹出将
第一个点与数组中的所有其他点进行比较，查找落在 x 距离内的点
创建一个簇原始点和接近点。
从数组中删除接近点
现在重复

我发布这是低效的，这也是我一直在研究 GIS 系统的原因。我已经设置了 PostGIS 并拥有我的纬度和纬度。长整型存储在 POINT 几何对象中。

有人可以帮助我开始或为我提供一些关于在 PostGIS 中简单实现此聚类算法的资源吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

撩动你心 2024-11-23 17:35:25

我最终使用了 snaptogrid 和平均值。我意识到有一些算法（即丹尼斯建议的 kmeans）可以为我提供更好的集群，但对于我正在做的事情来说，这是足够快和准确的。

回复收藏 0 原文

哽咽笑 2024-11-23 17:35:25

如果浏览器中的内容集群就足够了，那么您可以轻松利用 OpenLayer 的集群功能。有 3 个示例显示聚类。

我之前曾将它与 PostGIS 数据库一起使用，只要你没有大量的数据，它就可以非常顺利地工作。

回复收藏 0 原文

寄离 2024-11-23 17:35:25

使用 PostGIS 对 lonlat 点（st_point 类型）进行聚类的示例。结果集将包含 (cluster_id, id) 对。簇数是传递给 ST_ClusterKMeans 的参数。

WITH sparse_places AS (
  SELECT
    lonlat, id, COUNT(*) OVER() as count
  FROM places
) 
  SELECT
    sparse_places.id,
    ST_ClusterKMeans(lonlat::geometry, LEAST(count::integer, 10)) OVER() AS cid
  FROM sparse_places;

我们需要带有 COUNT 窗口函数的公共表表达式，以确保提供给 ST_ClusterKMeans 的簇数永远不会低于输入行数。

An example of clustering lonlat points (of st_point type) with PostGIS. The result set will contain (cluster_id, id) pairs. The number of clusters is the argument passed to ST_ClusterKMeans.

WITH sparse_places AS (
  SELECT
    lonlat, id, COUNT(*) OVER() as count
  FROM places
) 
  SELECT
    sparse_places.id,
    ST_ClusterKMeans(lonlat::geometry, LEAST(count::integer, 10)) OVER() AS cid
  FROM sparse_places;

We need the Common Table Expression with a COUNT window function in order to make sure the number of clusters provided to ST_ClusterKMeans never goes below the number of input rows.