arXiv每日學術速遞 - IROS 2021 | PTT：把Transformer應用到3D點雲目標跟蹤任務－鑽石舞台

PTT: Point-Track-Transformer Module for 3D Single Object Tracking in Point Clouds

論文已於今年六月份中稿機器人領域頂會IROS 2021。

論文地址：https://arxiv.org/abs/2108.06455

作者單位：東北大學（瀋陽）

代碼整理中，即將開源：

https://github.com/shanjiayao/PTT

實驗視頻鏈接：

bilibili: https://www.bilibili.com/video/BV1Uf4y157UE/

YouTube：https://www.youtube.com/watch?v=lttRtYXxUic

主要貢獻：

一個針對基於點雲三維單目標跟蹤的Point-Track-Transformer (PTT)模塊，可以在追蹤過程中有效權衡點雲特徵以聚焦於更深層次的目標線索。

一個嵌入了PTT組件的PTT-NET網絡，可進行端到端的訓練。這是第一個基於點雲應用transformer到三維目標跟蹤任務的方法。(截止投稿時)

圖1: 與現有的三維單目標跟蹤方法相比，我們的PTT模塊在計算相似度特徵後根據特徵的重要性對特徵進行加權，以提高跟蹤器的性能。

摘要：

三維單目標跟蹤是機器人技術中的一個關鍵問題。本文提出了一種基於點雲的三維單目標跟蹤的transformer 模塊：Point-Track-Transformer (PTT)。PTT模塊包含特徵嵌入、位置編碼和自注意力三個模塊特徵計算。特徵嵌入旨在將語義信息相似的特徵在嵌入空間中放置得更近。位置編碼用於將原始點雲坐標編碼為高維可分辨特徵。自注意通過計算注意權重產生更細化的注意力特徵。此外，我們將PTT模塊嵌入到開源方法P2B中來構建PTT-NET。在KITTI數據集上的實驗表明，我們的PTT-Net顯著的超越了現有的基於點雲的單目標跟蹤方法（漲了10個點）。此外，PTT-Net還可以在 1080Ti GPU上實現實時性能(40fps)。我們的代碼是面向機器人社區的開源代碼，網址是https：https://github.com/shanjiayao/PTT。