<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      機器人看不清,螞蟻給治好了

      0
      分享至

      天下苦機器人看不清透明反光物體久矣。

      畢竟就連小動物甚至人,有時候一個不小心,都會搞笑地撞到干凈的玻璃門……

      不僅如此,若是讓機器人拿起透明的玻璃杯反光的不銹鋼物體,他們也會經常出現“突然看不清了”的情況。

      這一切的問題,正是出在了機器人的眼睛——深度相機

      因為無論是基于結構光還是雙目立體視覺的深度相機,它們的工作原理都是依賴物體表面對光線的穩定反射。

      而透明材質會讓光線直接穿透,高反光材質則會將光線漫反射到四面八方,導致傳感器無法接收到有效的回波信號,從而產生大量缺失或錯誤的深度值。

      對比一下我們人類看到的場景和機器人眼中的場景,就一目了然了:

      毫不夸張地說,這類讓機器人睜眼看不清的問題,一直是阻礙它們安全地走進家庭、商場和醫院等場景的Big Big Big Problem!

      但現在,隨著一項新技術的提出,機器人的眼疾終于算是被治好了——

      螞蟻集團的具身智能公司螞蟻靈波科技(Robbyant),開源了全球看得最清楚的深度視覺模型,LingBot-Depth

      同樣是上面兩個場景,我們直接來看下在LingBot-Depth加持下的效果:

      也正因如此,機器人現在不論是抓取反光的不銹鋼杯子,還是透明的玻璃杯,都是易如反掌:

      視頻地址:https://mp.weixin.qq.com/s/y-5vx4MVlkucEMwxNQunJA

      用一句經典歇后語來表達這個feel,或許就是“老太太戴眼鏡——不簡單”

      確實不簡單。

      因為LingBot-Depth不僅解鎖了“全球看得最清楚”的頭銜,還是首次在不需要換硬件的條件下就能實現的那種。

      那么螞蟻靈波到底是怎么做到的,我們這就細扒一下論文。

      咋就一下子能看清了?

      在很多非專業討論中,透明和反光常常被混為一談,統稱為視覺難點。

      但若是從算法層面來看,它倆其實是兩類截然不同、甚至相反的問題。

      首先,透明物體的問題在于信息缺失

      玻璃幾乎不提供穩定的紋理,也不會像普通物體那樣反射環境光,相機看到的,更多是背景的延續。

      對于深度模型來說,它既不知道玻璃本身到哪兒才算結束,也不知道真實厚度和形態。

      而反光物體的問題,恰恰相反,是信息過載

      高反射率表面會把環境、光源、相機本身統統映射進畫面,導致同一物體在不同角度、不同時間下呈現完全不同的外觀。

      因此,模型很難判斷,哪些像素屬于物體,哪些只是倒影。

      這也意味著,如果用一套統一的假設去處理這兩類問題,往往兩頭都做不好。

      LingBot-Depth的一個重要設計思想,正是明確區分透明和反光這兩種類型的物理成因,而不是把它們簡單當成噪聲。

      為此,螞蟻靈波團隊想到了一個非常反直覺的解法

      既然傳感器在這些地方失效了,那這個失效本身,不就是一種最有力的特征嗎?

      因為傳感器輸出的那些缺失區域,其實是一個天然的掩碼(Natural Mask),起碼可以告訴模型這塊區域有問題。

      受今年大火的MAE(Masked Autoencoders)的啟發,團隊便提出了一種名為Masked Depth Modeling(MDM,掩碼深度建模)全新范式。

      簡單來說,LingBot-Depth在訓練的過程中,會把深度圖中那些天然缺失的區域作為掩碼,然后要求模型僅憑完整的RGB彩色圖像和剩余的有效深度信息,去腦補出被掩碼遮住的那部分深度。

      但這個過程也是非常具有挑戰性的。

      模型必須學會從RGB圖像中挖掘出極其細微的線索,比如玻璃邊緣的折射畸變、反光表面的環境倒影、物體的輪廓和陰影,然后將這些視覺上下文與已知的幾何信息進行深度融合,才能做出準確的推斷。

      為了實現這一目標,LingBot-Depth在技術架構上也是做了一些小巧思:

      首先是聯合嵌入的ViT架構。

      模型采用視覺Transformer(ViT-Large)作為主干網絡,它會對輸入的RGB圖像和深度圖分別進行分塊(Patch Embedding),生成兩組Tokens。

      為了區分這兩種模態,模型還引入了模態編碼(Modality Embedding),告訴網絡哪些令牌來自顏色,哪些來自深度。隨后,通過自注意力機制,模型能夠自動學習顏色與深度之間的精細對應關系,建立起跨模態的聯合表征。

      其次是智能掩碼策略。

      不同于MAE中完全隨機的掩碼,MDM的掩碼策略更聰明。它優先使用傳感器天然產生的缺失區域作為掩碼;對于部分有效、部分無效的深度塊,則以高概率(如75%)進行掩碼;如果天然掩碼不夠,才會補充一些隨機掩碼。

      這種策略確保了模型始終在解決最困難、最真實的問題。

      最后是ConvStack解碼器。

      在重建階段,模型放棄了傳統的Transformer解碼器,轉而采用一個名為ConvStack的卷積金字塔解碼器。

      這種結構在處理密集的幾何預測任務(如深度圖)時,能更好地保留空間細節和邊界銳度,輸出的深度圖更加清晰、連貫。

      此外,在數據采集與實驗驗證環節,團隊還使用了奧比中光(Orbbec)的Gemini 330系列雙目3D相機進行了大量真實場景的采集與測試。

      這不僅保證了數據來源的多樣性與真實性,也為模型在實際硬件平臺上的部署提供了重要支持。

      通過這種方式,LingBot-Depth不僅學會了補全深度,更重要的是,它將對3D幾何的深刻理解內化到了模型的“骨髓”里。

      即使在推理時只給它一張單目RGB圖片(沒有任何深度輸入),它也能憑借學到的先驗知識,估算出相當準確的深度圖,展現出強大的泛化能力。

      1000萬數據煉出來的

      一個模型再強大,也離不開高質量、大規模的數據。

      螞蟻靈波團隊構建了一套可擴展的數據采集與合成的pipeline,其中,200萬來自真實世界,100萬來自高保真仿真模擬;同時,還結合了開源數據,最終數據量達到了1000萬。

      真實數據方面,團隊設計了一套模塊化的3D打印采集裝置,可以靈活適配多種商用RGB-D相機(如Orbbec Gemini、Intel RealSense、ZED等)。

      他們走遍了住宅、辦公室、商場、餐廳、健身房、醫院、停車場等數十種場景,系統性地收集了大量包含透明、反光、低紋理等挑戰性物體的真實數據。這些數據覆蓋了極其豐富的長尾場景,為模型的魯棒性打下了堅實基礎。

      仿真數據方面,為了模擬真實深度相機的成像缺陷,團隊沒有簡單地渲染完美的深度圖,而是在Blender中同時渲染RGB圖像和帶散斑的紅外立體圖像對。再通過經典的半全局匹配(SGM)算法生成有缺陷的仿真深度圖。

      這種方法能高度還原真實傳感器在面對復雜材質時的失效模式。

      值得注意的是,這套包含200萬真實和100萬仿真數據的龐大數據集,是螞蟻靈波團隊近期計劃開源的重要資產,旨在降低整個行業在空間感知領域的研究門檻。

      算法夠創新,數據夠硬核,這才有了LingBot-Depth突出的性能表現。

      在多個權威的深度補全基準測試(如iBims、NYUv2、DIODE)上,它全面碾壓了當前最先進的SOTA。

      尤其是在最嚴苛的極端設定下(深度圖大面積缺失并伴有嚴重噪聲),LingBot-Depth的RMSE指標比此前最好的方法降低了超過40%。

      除此之外,盡管模型是在靜態圖像上訓練的,但它在視頻序列上展現出了驚人的時空一致性。

      在一段包含玻璃大門、有鏡子和玻璃的健身房、海洋館隧道的視頻中,LingBot-Depth 輸出的深度流不僅填補了原始傳感器的大片空洞,而且在整個視頻過程中保持平滑、穩定,沒有任何閃爍或跳變。

      為了驗證LingBot-Depth 在真實世界中的價值,螞蟻靈波團隊將其部署到了一臺真實的機器人平臺上。

      這套系統由Rokae(節卡)XMate-SR5機械臂、X Hand-1靈巧手和搭載了 LingBot-Depth 的 Orbbec Gemini 330 系列深度相機組成。

      視頻地址:https://mp.weixin.qq.com/s/y-5vx4MVlkucEMwxNQunJA

      實驗目標是抓取一系列對深度感知極具挑戰的物體:不銹鋼杯、透明玻璃杯、透明收納盒和玩具車。

      在20次抓取嘗試中,使用LingBot-Depth的成功率遠高于使用原始深度數據。

      缺點,有時也是一種優勢

      解決物理世界的感知難題,好的硬件固然重要,但不一定非要死磕。

      這或許就是LingBot-Depth給行業帶來的一種啟發。

      因為在過去,當現有深度相機無法滿足需求時,唯一的出路往往是斥巨資更換更昂貴、更專業的硬件。

      而LingBot-Depth提供了一條軟硬協同的路徑:它可以在不更換現有相機硬件的前提下,通過算法大幅提升深度感知的魯棒性與完整性。

      它可以作為一個即插即用的算法模塊,無縫集成到現有的機器人、自動駕駛汽車或AR/VR設備的感知鏈路中,以極低的成本,顯著提升其在復雜真實環境下的3D感知魯棒性。

      例如,在與奧比中光等硬件適配的過程中,團隊驗證了LingBot-Depth能夠在其現有消費級深度相機上實現接近專業級傳感器的感知效果。

      這無疑將大大加速具身智能在家庭服務、倉儲物流、商業零售等場景的落地進程。

      更重要的是,螞蟻靈波秉承開放精神,已經開源了LingBot-Depth的代碼和模型權重,并計劃開源其龐大的300萬RGB-D數據集。

      這一舉動將極大地降低學術界和工業界在空間感知領域的研究與開發門檻,有望催生更多創新應用,共同推動整個行業的向前發展。

      除此之外,LingBot-Depth也是有哲學意味在身上的:

      有時候,缺點本身就是一種優勢。

      你覺得呢?

      項目地址:
      https://technology.robbyant.com/lingbot-depth

      GitHub地址:
      https://github.com/robbyant/lingbot-depth

      HuggingFace地址:
      https://huggingface.co/robbyant/lingbot-depth

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      我媽三婚當晚,繼父的兒子拉我進廁所,我正要呼救,他卻突然開口:帶著你媽趕緊跑!

      我媽三婚當晚,繼父的兒子拉我進廁所,我正要呼救,他卻突然開口:帶著你媽趕緊跑!

      背包旅行
      2026-04-05 15:06:19
      韓女星樸娜萊和男性朋友在車上發生了性關系,兩名經紀人被迫圍觀

      韓女星樸娜萊和男性朋友在車上發生了性關系,兩名經紀人被迫圍觀

      西樓知趣雜談
      2026-04-09 09:35:17
      上海街頭偶遇奚夢瑤!無妝造生圖,網友吵翻:臉普通但氣質殺瘋了

      上海街頭偶遇奚夢瑤!無妝造生圖,網友吵翻:臉普通但氣質殺瘋了

      星Xin辰大海
      2026-05-10 00:10:00
      臺官員曝賴清德成功返臺內幕,大陸出手阻止未果,背后有難言之隱

      臺官員曝賴清德成功返臺內幕,大陸出手阻止未果,背后有難言之隱

      共工之錨
      2026-05-07 00:04:56
      章子怡沒想到,清空賬號、劃清界限的森林北,揭開汪峰僅剩的體面

      章子怡沒想到,清空賬號、劃清界限的森林北,揭開汪峰僅剩的體面

      好賢觀史記
      2026-05-08 15:53:17
      三連曝,中山大學腫瘤防治中心常務副主任馬某論文被舉報涉嫌圖片重復?

      三連曝,中山大學腫瘤防治中心常務副主任馬某論文被舉報涉嫌圖片重復?

      文憶天下
      2026-05-09 08:41:03
      光纖10倍擴產引爆材料荒,國產替代迎來千載難逢良機

      光纖10倍擴產引爆材料荒,國產替代迎來千載難逢良機

      粵語音樂噴泉
      2026-05-09 16:14:45
      熱議成都勝河南:奪冠懸念最早破解的賽季,拜合拉木漲球了

      熱議成都勝河南:奪冠懸念最早破解的賽季,拜合拉木漲球了

      懂球帝
      2026-05-09 23:01:02
      吳宜澤奪冠不到72小時,姐姐“私生活”被扒,終究步入趙心童后塵

      吳宜澤奪冠不到72小時,姐姐“私生活”被扒,終究步入趙心童后塵

      白面書誏
      2026-05-09 14:59:24
      特朗普高調釋放訪華信號,為何中方始終回應四個字?藏著大智慧

      特朗普高調釋放訪華信號,為何中方始終回應四個字?藏著大智慧

      新浪財經
      2026-05-10 00:52:32
      金粉,玉芬有能力會賺錢家世容貌都拔尖兒,太太為啥卻恨三兒媳?

      金粉,玉芬有能力會賺錢家世容貌都拔尖兒,太太為啥卻恨三兒媳?

      梨萊
      2026-05-07 22:29:08
      英超爭冠大戰!曼城打強隊不勝=出局,西漢姆對阿森納改寫4隊命運

      英超爭冠大戰!曼城打強隊不勝=出局,西漢姆對阿森納改寫4隊命運

      體育知多少
      2026-05-09 09:40:44
      掃地出門!AC米蘭同意6000萬出售當家球星!兩大“標王”同時離隊

      掃地出門!AC米蘭同意6000萬出售當家球星!兩大“標王”同時離隊

      頭狼追球
      2026-05-09 15:27:01
      心梗去世的人越來越多!醫生再次強調:寧可打打牌,也別做這5事

      心梗去世的人越來越多!醫生再次強調:寧可打打牌,也別做這5事

      醫學原創故事會
      2026-05-09 00:03:23
      西漢姆聯對陣阿森納:自布拉格以來最重要的比賽,保級命運懸而未決

      西漢姆聯對陣阿森納:自布拉格以來最重要的比賽,保級命運懸而未決

      綠茵情報局
      2026-05-09 22:32:01
      88億桶石油橫空出世!中國振華石油立大功,伊拉克這回挖到寶了

      88億桶石油橫空出世!中國振華石油立大功,伊拉克這回挖到寶了

      全球風情大揭秘
      2026-05-09 16:18:06
      男子冒充大老板,訂購5輛奔馳,總價450萬。美女銷售為促成大單,為其墊付6000余元食宿,誰知,3天后,男子突然消失,女銷售才發現被騙

      男子冒充大老板,訂購5輛奔馳,總價450萬。美女銷售為促成大單,為其墊付6000余元食宿,誰知,3天后,男子突然消失,女銷售才發現被騙

      大愛三湘
      2026-05-08 11:09:27
      狗子脖子被水壺套住,這樣生活了四年?!都快嵌進肉里,終于取下來了...

      狗子脖子被水壺套住,這樣生活了四年?!都快嵌進肉里,終于取下來了...

      英國那些事兒
      2026-05-08 23:22:11
      民政局里笑出聲 江蘇女子離婚閨蜜拍手叫好 凌晨3點陽臺卻出賣了她

      民政局里笑出聲 江蘇女子離婚閨蜜拍手叫好 凌晨3點陽臺卻出賣了她

      娛樂圈見解說
      2026-05-10 00:50:57
      體檢報告中,若3個指標都正常,基本可以排除很多疾病

      體檢報告中,若3個指標都正常,基本可以排除很多疾病

      芹姐說生活
      2026-05-08 19:06:29
      2026-05-10 01:43:00
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      12597文章數 176461關注度
      往期回顧 全部

      科技要聞

      美國政府強力下場 蘋果英特爾達成代工協議

      頭條要聞

      演員文章面館大火后又開酒吧 多位明星到場母親也現身

      頭條要聞

      演員文章面館大火后又開酒吧 多位明星到場母親也現身

      體育要聞

      成立128年后,這支升班馬首奪頂級聯賽冠軍

      娛樂要聞

      50歲趙薇臉頰凹陷滄桑得認不出!

      財經要聞

      多地號召,公職人員帶頭繳納物業費

      汽車要聞

      軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

      態度原創

      親子
      房產
      藝術
      公開課
      軍事航空

      親子要聞

      高能量、有氣場的孩子,媽媽只做3件小事

      房產要聞

      低價甩賣!海口這個地標商業,無人接盤!

      藝術要聞

      深圳終究失去“中國第一高樓”,華潤接手地塊!

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      美伊突然再次交火 伊朗外長:戰爭準備程度是1000%

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 在丈夫面前被侵犯| 高清偷拍一区二区三区| 日韩在线视频一区二区三| 韩国自拍偷自拍亚洲精品| 久热这里只国产精品视频| 西西4444www大胆无码| 久久天天躁狠狠躁夜夜中文字幕 | 亚洲成人在线资源| 午夜爽爽| 国产精品亚洲专区在线播放| 亚洲日韩在线视频| 亚洲精品aⅴ无码精品丝袜足| 久久99精品国产精品| 色一乱一伦一图一区二区精品| 人妖福利导航| 国产av大陆精品一区二区三区| 【乱子伦】国产精品www| 伊人激情av一区二区三区| 91中文视频| 成在线人免费| 永登县| 加比勒色综合久久| 久久不见久久见免费影院视频| 一级毛片a女人刺激视频免费| 欧美人与动牲交a免费| 97免费人妻无码视频| 大熟女在线| 91avav| 人妻av一区二区三区精品| 高清无码爆乳潮喷在线观看| 草草浮力影院| 97成人超碰| 国产成人精品免费视频大全| 国产亚洲情侣一区二区无| 国产91特黄特色A级毛片| 国产女人91精品嗷嗷嗷嗷| 狠狠躁夜夜躁人人爽超碰97香蕉| 成人aⅴ综合视频国产| 无码h黄肉3d动漫在线观看| 久久国产精品精品视频| 天天色综网|