![]()
在自動駕駛的日常測試視頻里,我們常能看到這樣的場景:
一輛無人車駛入幽深的地下車庫,GPS 信號瞬間罷工,它只能靠激光雷達掃描周圍環境,試圖弄清楚 “我在哪”。然而,車輛可能已經原地掉頭,拐過了好幾個彎,周圍只有冰冷的墻壁和立柱。就像你蒙上眼睛轉了幾圈,再睜開眼,面對一片空白的天花板,要準確說出自己面對的方向和所處的位置。
激光雷達重定位要解決的正是這個難題:僅憑一幀點云片段,估計出自己在全球坐標系中的 6 自由度位姿。
目前主流方法遵循 “檢索 - 配準” 范式,其精度可達分米級,但其存儲和計算壓力會隨場景規模急劇膨脹;另一種使用神經網絡直接預測位姿的方法(包括 APR 和 SCR),可實現十毫秒級的迅速響應,但其對角度敏感,精度僅在亞米級。就像天平的兩端,精度和效率似乎難以兼得,但
我全都要!廈門大學、布里斯托大學聯合提出激光雷達重定位方法LEADER,不僅實現十毫秒級的 “睜眼” 即定位,而且精度超越傳統的 “檢索 - 配準” 方法!
這項工作已被 CVPR 2026 接收為 Highlight,代碼和模型將全面開源!
![]()
- 論文標題:LEADER: Learning Reliable Local-to-Global Correspondences for LiDAR Relocalization
- 論文鏈接:https://arxiv.org/abs/2604.11355
- 倉庫鏈接:https://github.com/JiansW/LEADER
從效率專長,到效率性能兩開花
場景坐標回歸(SCR)方法在預測位姿時不需要顯式存儲地圖,而是使用神經網絡預測場景點的世界坐標,再通過 RANSAC 類方法預測當前的位姿。由于采用了 RANSAC 類幾何約束,在穩定性方面通常優于絕對位姿回歸(APR)方法。
相比傳統的 “檢索 - 配準” 模式,SCR 省去了顯式存儲點云特征的開銷,也不會因地圖增大導致存儲和計算成本飆升。但長期以來,SCR 方法精度維持在米級到亞米級,和 “檢索 - 配準 “方法相比呈現明顯的劣勢。于是作者提出了一個問題:
SCR 方法精度上真的無法比擬 “檢索 - 配準” 方法嗎?
這是論文出發的核心:既然 SCR 在存儲開銷和計算延遲上都存在明顯的優勢,如何讓其在保留這些優勢的基礎上,精度比肩甚至超越 “檢索 - 配準” 方法?
作者發現,有兩個明顯影響 SCR 精度的因素:
- 旋轉敏感:汽車在行駛過程中,如果轉個彎,精度會大幅下降,甚至會從亞米漂移到 10m 開外;
- 退化區域:環境中存在大量的噪聲和重復結構區域,比如長直走廊、空曠的地面等。要在這些高度相似的區域中找到其對應的世界坐標,就像讓人盯著白墻找指紋,只會輸出一堆 “幻覺對應”。
![]()
圖 1:LEADER 框架圖
LEADER:讓點云 “轉不暈”,
讓壞點 “靠邊站”
作者提出的 LEADER 框架,用以下幾乎零開銷的組件解決了以上痛點:
柱面投影 + 循環稀疏卷積(Spatial Transformation + Cartesian Recovery):在自動駕駛中,旋轉問題往往集中在偏航角上。因此作者將點云進行柱面投影,并輔以循環稀疏卷積來處理角度銜接的問題,從而實現對偏航角不變的特征,不管車頭朝南還是朝北,都擁有同一套穩定表示。此外,通過檢測地面點來將點云校正至水平,獲得了一定的俯仰角和橫滾角魯棒性。
TRR 損失(Truncated Relative Reliability Loss):每個點的質量不同,預測的難易程度差距很大,但我們不可能為場景中的每個點去人工標注質量信息。實際上,哪些點難以預測,模型在訓練時就已經 “告訴” 我們了,那就是每個點訓練時的歐氏距離損失。因此,在預測世界坐標的同時,作者還讓模型預測每個點 “好不好預測”,即 “置信度”。對于容易預測的點,置信度更高,反之則低。
那么,如何讓模型在無置信度相關真值的情況下實現置信度的預測呢?作者設計了以下的 TRR 損失:
![]()
等號右側的求和符號內,是每個點的訓練權重 w 和其歐氏距離損失 L 相乘。而訓練權重則是由置信度歸一化得到的,這就相當于給模型指明了一條路:
如果某個點很難精準預測,即損失很難下降,那么模型可以給其輸出一個很低的置信度,這樣該點的訓練權重就會降低,最終降低總損失。而在置信度歸一化的過程中,作者限制了其范圍,這避免置信度范圍過大,從而出現模型只專注于學習少數點的問題。
在 RANSAC 階段,作者選擇高置信度的點來擬合位姿,進一步削弱了 “壞點” 的影響。
實驗結果:全面領先
在 NCLT 數據集上,LEADER 大幅超越了當前的隱式神經網絡方法(APR 和 SCR),定位精度從 APR 的 1.19 m 和 SCR 的 1.51 m 提升至 0.31 m:
![]()
表 1:NCLT 數據集上的實驗結果
作者還與同樣具有旋轉魯棒性的 “檢索 - 配準” 方法 RING/RING++ 進行了對比,并取兩種方法中最優值作為參考。在同樣 xy 平面上的定位精度中,LEADER 的平均定位精度達到 0.28 m,大幅超越了 RING/RING++ 方法;5 m 內的失敗率僅 0.28%,不到 RING/RING++ 失敗率的 1 / 25,甚至在基本不受失敗率影響的中位數上,LEADER 的 0.21 m 也明顯領先:
![]()
表 2:與 “檢索 - 配準” 方法的對比結果
置信度分析:
讓模型學會 “有所取舍”
在 NCLT 數據集上,旋轉問題并不突出,為什么 LEADER 仍然有如此大的提升?TRR 損失引入了置信度信息,作者對該模塊進行了分析,首先對測試集中所有點按其置信度進行了排序,并繪制了點的置信度和預測誤差之間的關系:
![]()
圖 2:點置信度與預測誤差的關系
可以看到,兩者呈現明確的反相關,說明在預測階段置信度信息非常有效。而預測階段僅使用置信度高的點也進一步排除了 “壞點” 的影響。
作者還將 TRR 和常規的歐式距離損失進行了對比:
![]()
圖 3:TRR 模塊的消融實驗
結果表明,TRR 損失不僅能讓模型在訓練中自適應調整每個點的權重,從而實現置信度預測,而且使預測出的高精度點的比例翻倍。
后記
這給了我們一個啟示,在并不需要完整記憶所有內容的場景中,與其讓模型去死記硬背那些難以學習的數據,不如讓模型自己選擇應該記住什么。因為參數一旦確定,模型的記憶容量就是固定的,“壞點” 會消耗模型大量的容量去嘗試記住它們,結果不僅記不住,反而會干擾訓練,影響 “好點” 的數量。
有時候,模型并非越復雜越有效,核心模塊往往恰恰是其中簡單的部分,如果能分析出模型的瓶頸因素,并為其 “引流”,即可能引發質變,簡約而不失優雅。
作者介紹
本文第一作者來自廈門大學信息學院空間感知與計算實驗室(ASCLab)2023 級碩士生吳建實,通訊作者為廈門大學敖晟助理教授,并由朱明航、劉敦強、李文(布里斯托大學)、沈思淇副教授、溫程璐教授、王程教授共同合作完成。研究團隊長期聚焦定位相關的算法研究。
實驗室主頁:https://asc.xmu.edu.cn/
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.