網易首頁 > 網易號 > 正文申請入駐

超越傳統檢索方法！我們激光雷達重定位方法在精度和效率上雙豐收

2026-05-05 15:09:58　來源: 機器之心Pro

河北舉報

分享至

在自動駕駛的日常測試視頻里，我們常能看到這樣的場景：

一輛無人車駛入幽深的地下車庫，GPS 信號瞬間罷工，它只能靠激光雷達掃描周圍環境，試圖弄清楚 “我在哪”。然而，車輛可能已經原地掉頭，拐過了好幾個彎，周圍只有冰冷的墻壁和立柱。就像你蒙上眼睛轉了幾圈，再睜開眼，面對一片空白的天花板，要準確說出自己面對的方向和所處的位置。

激光雷達重定位要解決的正是這個難題：僅憑一幀點云片段，估計出自己在全球坐標系中的 6 自由度位姿。

目前主流方法遵循 “檢索 - 配準” 范式，其精度可達分米級，但其存儲和計算壓力會隨場景規模急劇膨脹；另一種使用神經網絡直接預測位姿的方法（包括 APR 和 SCR），可實現十毫秒級的迅速響應，但其對角度敏感，精度僅在亞米級。就像天平的兩端，精度和效率似乎難以兼得，但

我全都要！廈門大學、布里斯托大學聯合提出激光雷達重定位方法LEADER，不僅實現十毫秒級的 “睜眼” 即定位，而且精度超越傳統的 “檢索 - 配準” 方法！

這項工作已被 CVPR 2026 接收為 Highlight，代碼和模型將全面開源！

論文標題：LEADER: Learning Reliable Local-to-Global Correspondences for LiDAR Relocalization
論文鏈接：https://arxiv.org/abs/2604.11355
倉庫鏈接：https://github.com/JiansW/LEADER

從效率專長，到效率性能兩開花

場景坐標回歸（SCR）方法在預測位姿時不需要顯式存儲地圖，而是使用神經網絡預測場景點的世界坐標，再通過 RANSAC 類方法預測當前的位姿。由于采用了 RANSAC 類幾何約束，在穩定性方面通常優于絕對位姿回歸（APR）方法。

相比傳統的 “檢索 - 配準” 模式，SCR 省去了顯式存儲點云特征的開銷，也不會因地圖增大導致存儲和計算成本飆升。但長期以來，SCR 方法精度維持在米級到亞米級，和 “檢索 - 配準 “方法相比呈現明顯的劣勢。于是作者提出了一個問題：

SCR 方法精度上真的無法比擬 “檢索 - 配準” 方法嗎？

這是論文出發的核心：既然 SCR 在存儲開銷和計算延遲上都存在明顯的優勢，如何讓其在保留這些優勢的基礎上，精度比肩甚至超越 “檢索 - 配準” 方法？

作者發現，有兩個明顯影響 SCR 精度的因素：

旋轉敏感：汽車在行駛過程中，如果轉個彎，精度會大幅下降，甚至會從亞米漂移到 10m 開外；
退化區域：環境中存在大量的噪聲和重復結構區域，比如長直走廊、空曠的地面等。要在這些高度相似的區域中找到其對應的世界坐標，就像讓人盯著白墻找指紋，只會輸出一堆 “幻覺對應”。

圖 1：LEADER 框架圖

LEADER：讓點云 “轉不暈”，

讓壞點 “靠邊站”

作者提出的 LEADER 框架，用以下幾乎零開銷的組件解決了以上痛點：

柱面投影 + 循環稀疏卷積（Spatial Transformation + Cartesian Recovery）：在自動駕駛中，旋轉問題往往集中在偏航角上。因此作者將點云進行柱面投影，并輔以循環稀疏卷積來處理角度銜接的問題，從而實現對偏航角不變的特征，不管車頭朝南還是朝北，都擁有同一套穩定表示。此外，通過檢測地面點來將點云校正至水平，獲得了一定的俯仰角和橫滾角魯棒性。

TRR 損失（Truncated Relative Reliability Loss）：每個點的質量不同，預測的難易程度差距很大，但我們不可能為場景中的每個點去人工標注質量信息。實際上，哪些點難以預測，模型在訓練時就已經 “告訴” 我們了，那就是每個點訓練時的歐氏距離損失。因此，在預測世界坐標的同時，作者還讓模型預測每個點 “好不好預測”，即 “置信度”。對于容易預測的點，置信度更高，反之則低。

那么，如何讓模型在無置信度相關真值的情況下實現置信度的預測呢？作者設計了以下的 TRR 損失：

等號右側的求和符號內，是每個點的訓練權重 w 和其歐氏距離損失 L 相乘。而訓練權重則是由置信度歸一化得到的，這就相當于給模型指明了一條路：

如果某個點很難精準預測，即損失很難下降，那么模型可以給其輸出一個很低的置信度，這樣該點的訓練權重就會降低，最終降低總損失。而在置信度歸一化的過程中，作者限制了其范圍，這避免置信度范圍過大，從而出現模型只專注于學習少數點的問題。

在 RANSAC 階段，作者選擇高置信度的點來擬合位姿，進一步削弱了 “壞點” 的影響。

實驗結果：全面領先

在 NCLT 數據集上，LEADER 大幅超越了當前的隱式神經網絡方法（APR 和 SCR），定位精度從 APR 的 1.19 m 和 SCR 的 1.51 m 提升至 0.31 m：

表 1：NCLT 數據集上的實驗結果

作者還與同樣具有旋轉魯棒性的 “檢索 - 配準” 方法 RING/RING++ 進行了對比，并取兩種方法中最優值作為參考。在同樣 xy 平面上的定位精度中，LEADER 的平均定位精度達到 0.28 m，大幅超越了 RING/RING++ 方法；5 m 內的失敗率僅 0.28%，不到 RING/RING++ 失敗率的 1 / 25，甚至在基本不受失敗率影響的中位數上，LEADER 的 0.21 m 也明顯領先：

表 2：與 “檢索 - 配準” 方法的對比結果

置信度分析：

讓模型學會 “有所取舍”

在 NCLT 數據集上，旋轉問題并不突出，為什么 LEADER 仍然有如此大的提升？TRR 損失引入了置信度信息，作者對該模塊進行了分析，首先對測試集中所有點按其置信度進行了排序，并繪制了點的置信度和預測誤差之間的關系：

圖 2：點置信度與預測誤差的關系

可以看到，兩者呈現明確的反相關，說明在預測階段置信度信息非常有效。而預測階段僅使用置信度高的點也進一步排除了 “壞點” 的影響。

作者還將 TRR 和常規的歐式距離損失進行了對比：

圖 3：TRR 模塊的消融實驗

結果表明，TRR 損失不僅能讓模型在訓練中自適應調整每個點的權重，從而實現置信度預測，而且使預測出的高精度點的比例翻倍。

后記

這給了我們一個啟示，在并不需要完整記憶所有內容的場景中，與其讓模型去死記硬背那些難以學習的數據，不如讓模型自己選擇應該記住什么。因為參數一旦確定，模型的記憶容量就是固定的，“壞點” 會消耗模型大量的容量去嘗試記住它們，結果不僅記不住，反而會干擾訓練，影響 “好點” 的數量。

有時候，模型并非越復雜越有效，核心模塊往往恰恰是其中簡單的部分，如果能分析出模型的瓶頸因素，并為其 “引流”，即可能引發質變，簡約而不失優雅。

作者介紹

本文第一作者來自廈門大學信息學院空間感知與計算實驗室（ASCLab）2023 級碩士生吳建實，通訊作者為廈門大學敖晟助理教授，并由朱明航、劉敦強、李文（布里斯托大學）、沈思淇副教授、溫程璐教授、王程教授共同合作完成。研究團隊長期聚焦定位相關的算法研究。

實驗室主頁：https://asc.xmu.edu.cn/

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.