安光所光电子中心在物体特征编码方面取得新进展
方翠云
近日,光电子技术研究中心计算机视觉团队在物体级结构化表征与匹配方向取得新进展,提出了Beyond Appearance: Dual-Graph Object Encoding with Learnable Graph Structure(DGOE)方法,相关成果发表于 IEEE Signal Processing Letters(IEEE 信号处理快报)。
物体编码(Object Encoding)是机器人进行识别、导航与自主探索等任务的关键基础。现有方法主要依赖外观特征,面对外观高度相似但并非同一物体的复杂环境时,容易出现混淆,从而影响下游任务的可靠性。
针对这一痛点,研究人员借鉴人类对物体“外观+结构”的联合感知方式,提出了一种双图嵌入(Dual-Graph Embedding)的物体编码框架:将物体可区分性显式分解为两条互补线索,一是描述物体自身组成与几何组织的内在结构(inner-object graph),二是刻画物体与周围物体空间关联的跨物体关系上下文(cross-object graph)。该方法以图结构为载体融合物体外观与空间关系信息,并进一步利用多头自注意力学习跨物体图结构,从而提取更有效的跨物体空间特征,获得更稳定、更具辨识度的物体表示。
博士研究生方翠云为论文第一作者,张超凡博士和邓国庆正高级工程师为论文通讯作者。该研究工作得到国家自然科学基金、合肥物质科学研究院院长基金等项目支持。
文章链接:https://ieeexplore.ieee.org/document/11371448
新闻资讯 