AAAI(The Fortieth AAAI Conference on Artificial Intelligence)由国际人工智能促进会(AAAI)主办,专注于人工智能理论、技术及应用的前沿原创性研究,涵盖机器学习、自然语言处理、计算机视觉、知识表示与推理等方向,是人工智能领域历史最悠久的国际学术会议之一。该会议成立于1979年,被中国计算机学会(CCF)和中国人工智能学会(CAAI)列为A类国际学术会议。AAAI2026会议录用率为17.6%。
论文题目:AerialMind: Towards Referring Multi-Object Tracking in UAV Scenarios
硕 士 生:梁少峰(2023级)
收录会议:The Fortieth AAAI Conference on Artificial Intelligence (AAAI-26), Oral
指导教师:陈程立诏
论文概述:该成果旨在提出首个面向无人机场景的大规模语言引导多目标跟踪基准。多目标跟踪(RMOT)旨在通过自然语言指令实现精确的目标检测和跟踪,这是智能机器人系统的一项基本能力。然而,目前的 RMOT研究大多局限于地面场景,这限制了其捕捉大范围场景上下文以及进行全面跟踪和路径规划的能力。相比之下,无人机(UAV)凭借其广阔的空中视角和卓越的机动性,能够实现广域监视。此外,无人机已成为具身智能的关键平台,这使得对能够进行自然语言交互的智能空中系统的需求空前高涨。为此,我们推出了 AerialMind,这是首个针对无人机场景的大规模 RMOT基准测试平台,旨在弥合这一研究空白。为了便于构建 AerialMind,我们开发了一种创新的半自动化协作式基于代理的标注助手(COALA)框架,该框架在显著降低人工成本的同时,还能保持标注质量。此外,我们提出了一种名为 HawkEyeTrack (HETrack)的新方法,该方法协同增强了视觉语言表征学习,并提高了对无人机场景的感知能力。全面的实验验证了我们数据集的挑战性以及我们方法的有效性。


当前位置: