当前位置: 首页 > news >正文

GroundingDino针对航空图像检测的改进 MM Grounding Dino Large - MKT

https://arxiv.org/abs/2401.02361

image

 

image

 

image

 

测试数据集构建

针对无人机航拍特性,构建包含以下场景的测试集:

  • 城市航拍:建筑物、车辆、行人(分辨率3840×2160)
  • 乡村农田:农机、作物行、电线杆(分辨率2560×1440)
  • 灾害救援:倒塌建筑、救援车辆、幸存者(分辨率1920×1080)

image

 

典型案例分析
小目标检测能力:在300米高空拍摄的农田图像中(单个农机目标像素尺寸约20×30),模型实现89.7%的召回率,优于YOLOv8x的76.2%。通过可视化特征图可见,Swin-Large的stage4特征层(1/32下采样)仍能保留农机的关键轮廓信息。

类别泛化能力:对于训练集中未出现的"太阳能光伏板"类别,通过文本提示"a solar panel with blue cells",模型实现零样本检测mAP 37.5,验证了GOLD-G数据集带来的开放式词汇理解能力。

 

image

image

 

http://icebutterfly214.com/news/560/

相关文章:

  • 25.10.27
  • go构建streamablehttp mcp服务
  • 对Grid绑定移动
  • 10.27博客
  • [Mirror] LinuxMirrors: Linux 一键换源项目
  • 20232309 2025-2026-1 《网络与系统攻防技术》实验三实验报告
  • 衡量模型生成图片质量的指标
  • 【转载】‘tensorrt.tensorrt.Builder‘ object has no attribute ‘build_cuda_engine‘
  • 20232403 2025-2026-1 《网络与系统攻防技术》实验三实验报告
  • WPF datagrid mvvm loaded 100M items,prism.wpf,prism.dryioc
  • sg.绑定键盘事件
  • 壁纸收集
  • Windows11安装miniconda
  • 10.27 CSP-S模拟40 改题记录
  • 详细介绍:Redis多租户资源隔离方案:基于ACL的权限控制与管理
  • 20251027周一日记
  • 学校协同云盘怎么选?2025年10大热门教育网盘推荐与对比
  • GPU集群之间的交互
  • CF1267G Game Relics
  • 102302115方朴第一次作业
  • 解题报告-梦熊 CSP-S2025 模拟赛T2
  • 鄙“站”麻将和算24,刷新后会换
  • 20232422 2025-2026-1 《网络与系统攻防技术》实验三实验报告
  • 20232404 2025-2026-1 《网络与系统攻防技术》实验三实验报告
  • 「WC2014-紫荆花之恋」题解
  • 谢谢你周医生
  • 来源未知
  • Date 10.27
  • 10.27及动手动脑
  • go包装bing搜索