当前位置: 首页 > news >正文

GroundingDino针对航空图像检测的改进 MM Grounding Dino Large - MKT

https://arxiv.org/abs/2401.02361

image

 

image

 

image

 

测试数据集构建

针对无人机航拍特性,构建包含以下场景的测试集:

  • 城市航拍:建筑物、车辆、行人(分辨率3840×2160)
  • 乡村农田:农机、作物行、电线杆(分辨率2560×1440)
  • 灾害救援:倒塌建筑、救援车辆、幸存者(分辨率1920×1080)

image

 

典型案例分析
小目标检测能力:在300米高空拍摄的农田图像中(单个农机目标像素尺寸约20×30),模型实现89.7%的召回率,优于YOLOv8x的76.2%。通过可视化特征图可见,Swin-Large的stage4特征层(1/32下采样)仍能保留农机的关键轮廓信息。

类别泛化能力:对于训练集中未出现的"太阳能光伏板"类别,通过文本提示"a solar panel with blue cells",模型实现零样本检测mAP 37.5,验证了GOLD-G数据集带来的开放式词汇理解能力。

 

image

image

 

http://www.fuzeviewer.com/news/560/

相关文章:

  • GroundingDino目标跟踪+sam2分割 - MKT
  • 人工智能十大数学知识 - 优化理论 - 何苦
  • 人工智能十大数学知识 - 概率与统计学 - 何苦
  • 刷题日记—链表—快慢指针的应用
  • 刷题日记——链表—二进制转十进制,虚拟头结点
  • [java - wait() 虚假唤醒]
  • 算法分析--分治--2.归并排序
  • Vue2随笔-251027
  • Java: Jdk17 异步或同步或并行发邮件
  • 噪声点验证码的图像处理与识别思路
  • 1027
  • 关系运算符逻辑运算符
  • 《程序员修炼之道》 阅读笔记三
  • 第四篇:docker底层原理
  • 关于springboot+Servlet报错404的问题
  • Codechef Painting Tree 题解 [ 蓝 ] [ 树形 DP ] [ 概率期望 ] [ 分类讨论 ]
  • 【CI130x 离在线】如何运行 curl 脚本
  • 这才是真正的AI NAS!极空间私有云Z2Ultra评测
  • 新东方第三节课名言作文
  • 十月阅读_3
  • 中考_体育
  • 常见问题处理 --- phpstudy启动mysql失败
  • 20232308 2025-2026-1 《网络与系统攻防技术》实验三实验报告
  • 【密码学实战】openHiTLS PKCS12命令行程序: PKCS12文件生成与解析
  • 「CTSC2017-游戏」题解
  • vue3 vue3-form-element表单生成工具 输入框增加后缀
  • 20232402 2025-2026-1 《网络与系统攻防技术》实验三实验报告
  • 掘金2025年:数字化商业浪潮下,如何选对平台与伙伴?一站式多商户商城系统推荐榜发布,多商户商城代理招募/多商户项目合伙人加盟/一站式开店代理项目加盟
  • 为医疗器械行业搭建“数字桥梁”,破解协同效率与合规难题
  • PostgreSQL 服务版