首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >AAAI 2026|DGKAN:结合KAN和图神经网络用于遥感多模态变化检测

AAAI 2026|DGKAN:结合KAN和图神经网络用于遥感多模态变化检测

作者头像
Amusi
发布2026-04-22 08:18:28
发布2026-04-22 08:18:28
1900
举报
文章被收录于专栏:CVerCVer

转载自:遥感与深度学习 题目:DGKAN: Dual-branch Graph Kolmogorov-Arnold Network for Unsupervised Multimodal Change Detection 期刊: AAAI 2026(The Fortieth AAAI Conference on Artificial Intelligence)论文: https://ojs.aaai.org/index.php/AAAI/article/view/37665 数据: 5个公开多模态变化检测数据集 代码: https://github.com/TongfeiLiu/DGKAN-for-MCD 年份: 2026单位: 陕西科技大学、西安理工大学

创新点

  • 提出了一种图Kolmogorov-Arnold网络(GKAN)模块,通过GCN与KAN的并行融合策略,同时建模空间结构关系和跨模态非线性映射
  • 基于GKAN设计了双分支框架DGKAN,用于无监督多模态变化检测,能够捕获模态无关的空间-光谱结构共性特征并直接比较以检测变化
  • 引入了协方差结构共性损失(CSCL),通过无监督约束跨模态特征的分布一致性,引导网络提取空间-光谱结构共性特征
  • 提出双图构建策略(光谱相似图和空间邻域图),从光谱和空间两个维度增强结构共性特征的表征能力

背景

多模态变化检测(MCD)在灾害评估和土地利用变化监测中具有重要应用价值。然而,由于不同传感器成像差异导致的特征非线性畸变和空间错位,使得多模态遥感影像难以通过直接比较获取变化信息。现有方法中,CNN受限于固定感受野,Transformer容易忽略局部结构信息,而传统GCN主要依赖线性图卷积层,难以建模多模态遥感影像间的复杂非线性关系。

近期兴起的Kolmogorov-Arnold网络(KAN)凭借其非线性建模能力在变化检测任务中取得了较好效果,这启发了将KAN与GCN结合的思路,以弥补GCN非线性建模能力的不足,同时保留图结构对空间关系的建模优势,从而实现更好的多模态遥感影像空间-光谱结构特征建模。

数据

本文使用了5个公开的多模态变化检测数据集,涵盖城市土地利用变化和自然灾害场景。

数据集 #1(黄河河岸侵蚀)
  • Radarsat-2与Google Earth影像,2008年6月/2010年9月
  • 尺寸444×291,空间分辨率8m,位于中国黄河区域
数据集 #2(建筑变化)
  • Radarsat-2与Google Earth影像,2008年6月/2012年9月
  • 尺寸593×921,空间分辨率8m,位于中国曙光区域
数据集 #3(洪水)
  • Spot与NDVI影像,1999/2000年
  • 尺寸990×554,空间分辨率约25m,位于英国格洛斯特
数据集 #4(洪水)
  • QuickBird-2与TerraSAR-X影像,2006年7月/2007年7月
  • 尺寸4135×2325,空间分辨率约0.65m,位于英国格洛斯特
数据集 #5(建筑变化)
  • Pleiades与WorldView2影像,2012年5月/2013年7月
  • 尺寸2000×2000,空间分辨率0.52m,位于法国图卢兹

方法

GKAN模块

GKAN通过并行路径架构实现结构建模与非线性特征解耦的联合优化。

KAN非线性特征映射路径
  • 利用KAN的自适应样条基函数进行非线性特征映射
  • 通过可学习线性权重矩阵和可微分样条基函数的稀疏组合实现高阶非线性建模
GCN结构建模路径
  • 与KAN并行的GCN路径完成基于邻域关系的特征更新
  • 通过归一化邻接矩阵建模图结构中的空间关系
注意力融合
  • 将GCN路径和KAN路径的输出沿序列维度堆叠
  • 通过线性投影获得Q、K、V,利用注意力机制融合两条路径的特征
DGKAN框架
图构建
  • 基于SLIC超像素分割统一空间单元
  • 双图构建策略:光谱相似图(基于节点特征的欧氏距离)和空间邻域图(基于空间坐标的k近邻)
  • 对不同模态数据分别采用最大-最小归一化或均值-方差归一化
孪生编码器-解码器结构
  • 孪生GKAN编码器:共享权重,分别处理两幅多模态影像的双图输入,提取空间-光谱结构共性特征
  • 两个独立GKAN解码器:分别重建各模态的原始节点特征,确保学习特征的有效性
损失函数
  • 重建损失:最小化原始节点特征与重建特征之间的均方误差
  • 协方差结构共性损失(CSCL):对编码器输出特征进行均值中心化和L2归一化后,计算跨模态特征协方差矩阵的均方误差,约束分布一致性
推理阶段
  • 使用训练好的孪生GKAN编码器提取结构共性特征
  • 通过均方误差计算差异图(DI)
  • 采用Otsu阈值分割生成二值变化图(BCM)

结果与分析

在5个多模态变化检测数据集上的实验表明,DGKAN在大多数数据集上达到了最优性能,生成的差异图具有清晰的变化强度层次和自然的梯度过渡。消融实验验证了GKAN模块和CSCL损失函数的有效性,其中将KAN分支替换为MLP后,Kappa指标平均下降了8.1%。

更多图表分析可见原文

本文系学术转载,如有侵权,请联系CVer小助手删文

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-04-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 CVer 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 创新点
  • 背景
  • 数据
    • 数据集 #1(黄河河岸侵蚀)
    • 数据集 #2(建筑变化)
    • 数据集 #3(洪水)
    • 数据集 #4(洪水)
    • 数据集 #5(建筑变化)
  • 方法
    • GKAN模块
      • KAN非线性特征映射路径
      • GCN结构建模路径
      • 注意力融合
    • DGKAN框架
      • 图构建
      • 孪生编码器-解码器结构
      • 损失函数
      • 推理阶段
  • 结果与分析
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档