作者 | 明日產品的
來源 | APPSO(ID:appsolution)
你或許刷到了一段來自印度南部服裝廠的視頻。
工廠工人佩戴頭戴攝像頭,記錄手部動作以訓練人工智能系統。
![]()
這是因為隨著特斯拉、Figure AI 等公司競相開發人形機器人,訓練它們所需的真實世界動作數據變得極為緊缺。
帕洛阿爾托的 Micro1 因此在全球 71 個國家招募了約 4000 名工人,每月收到超過 16 萬小時的視頻素材。每人每周至少提交 10 小時錄像,交替完成不同類型的任務。
Scale AI 和 Encord 也在招募各自的數據采集隊伍,DoorDash 甚至在 2026 年 3 月推出 Tasks 應用,讓旗下送餐員順帶在家錄家務視頻,不過專門排除了數據隱私法律嚴格的州。
每小時 15 美元
這份工作的具體操作,比聽起來要奇怪。
應聘者首先要通過一個叫 Zara 的 AI 智能體面試。Zara 會和你對話,評估你是否適合,并要求你提交一段試錄視頻。
通過之后,你會收到一個額頭頭帶支架、一份錄制說明,和一張任務清單。說明上寫著,要讓雙手始終保持在鏡頭可見范圍內,動作要“保持自然速度”。
可自然速度在攝像頭下往往顯得太快,所以工人們普遍反映,實際錄制時必須刻意放慢,結果動作反而變得不自然,像是在模仿夢游。
還有一個門檻:你需要帶有 LiDAR 傳感器的 iPhone,也就是至少要 iPhone 12 Pro 以上的機型。
視頻提交之后,還要經過 AI 和人工雙重審核,只有大約一半的素材最終可用。被拒的原因可能是光線不夠、手移出了畫面、動作太快,或者背景里出現了不該出現的東西。
工人按小時計酬,但如果視頻被拒,這段時間的勞動就白費了。通過審核的視頻,隨后還會進入一個標注流程,由另一批人工標注員逐幀標記動作類別、物體名稱和運動軌跡。
新德里的家教 Arjun 說,他通常要花一個小時構思,才能想出能錄滿 15 分鐘的家務內容。Micro1 要求工人不斷“變換內容”,因為多樣化的場景對訓練效果至關重要,但家的體量就那么大,創意遲早會耗盡。
美國家庭的視頻比其他地區賣得更貴。數據標注公司 Objectways 的創始人 Ravi Rajalingam 解釋說,因為機器人公司預設了美國消費者會最先購買人形機器人,所以美國家庭的操作環境數據更有價值,對應的工人時薪有時高達越南或印度工人的三倍。
![]()
圖源:https://newatlas.com/robotics/figures-humanoid-robots-household-chores-2025-helix-ai-brett-adcock/
Micro1 的副總裁 Arian Sadeghi 說,160 萬小時的月度素材遠遠不夠,“大概需要幾十億小時。我們連人與人之間的互動都還沒開始采集,現在只是最基礎的家務而已。”
幾十億小時,按照目前的采集速度,大概要連續工作一萬年。
幽靈勞動,顯形了
2019 年,人類學家 Mary Gray 和計算機科學家 Siddharth Suri 出版了一本書,叫 Ghost Work,直譯是“幽靈勞動”。
他們想描述的,是那些讓 AI 系統顯得“聰明”、卻從不出現在任何產品介紹里的人工勞動,標注圖片、過濾違規內容、清洗訓練數據。
![]()
《銷聲匿跡:數字化工作的真正未來》
著者:[美]瑪麗?L.格雷、[美] 西達爾特?蘇里
譯者:左安浦
Gray 說,當她剛開始研究這個問題時,去問工程師們,“誰在做這些工作”,得到的回答是“我也不太清楚”“我不敢去查”。
過去,幽靈工作主要發生在屏幕前,是點擊、標注、審核這樣的操作。現在,身體本身,疊衣服的手勢、炒菜的節奏、打開冰箱的動作,都開始成為可以被采集、被定價、被轉售的原材料。
這些原材料從印度、尼日利亞、菲律賓、肯尼亞的普通家庭流出,匯聚到帕洛阿爾托和舊金山的公司,再轉化成產品流向市場。
Nick Couldry 和 Ulises Mejias 在研究數字經濟時提出了一個框架,叫“數據殖民主義”,意思是:科技公司對數據的占有,在結構上延續了歷史殖民主義對土地和資源的掠取邏輯,把人類的日常生活本身轉化為一種可供資本提取的原材料。
放在 Micro1 的案例里,工人每小時拿到 15 美元,在內羅畢或馬尼拉是有競爭力的工資,但放在流入機器人公司的數十億美元投資面前,連零頭都算不上。
更值得注意的是信息上的不對等。Micro1 以保密為由,不向工人透露客戶名單,工人們也不清楚自己的數據將如何被存儲,會不會被轉售給其他第三方。工人簽了協議,收了錢,但他們在整條產業鏈里的信息處于末端,對自己正在參與的事情的全貌,知道得很少。
Gray 在研究幽靈勞動時發現了一件讓她印象深刻的事,工人們往往會自發找到彼此,建立非正式的互助網絡,因為工作本身提供的支持幾乎是零,人們必須靠彼此維持做下去的意義感。孤立是這類勞動的默認狀態。
2026 年,全球人形機器人市場預計達到 42.3 億美元,而到 2027 年,特斯拉等公司的量產計劃將使全球累計安裝量突破 10 萬臺。
這些機器人,大概率將進入工廠和家庭,承擔體力勞動。而訓練它們的數據,正是來自那些現在還在用體力勞動糊口的人。
![]()
圖源:https://developer.nvidia.com/blog/teaching-robots-to-tackle-household-chores/
我們知道的,多于我們能說出的
哲學家邁克爾·波蘭尼在 1958 年寫了一本書叫 Personal Knowledge,他在書里說:我們知道的,多于我們能夠說出的。他稱之為“默會知識”,意思是人類有大量的知識不以命題的形式存在,而是以動作、感知、直覺的形式附著在身體里。
![]()
騎自行車是一個常見的例子,你知道怎么保持平衡,但沒有辦法把這件事寫成一套可以教給別人的規則。它只能通過實踐習得,通過觀察、模仿和重復,在身體內部慢慢積累,而不能被直接傳遞。
波蘭尼寫這本書的時候,AI 還不存在。但他的論斷在今天獲得了一種新的現實重量。
我們正在做的事,是試圖把這種默會知識,從人的身體里抽取出來,轉化為機器可以處理的數據。
Micro1 的工人們額頭上的攝像頭錄下的,除了是一個疊衣服的動作,還是手指如何感知布料的重量,手腕如何在恰當的時機翻轉,視線如何在疊的過程中追蹤布料的邊緣。
![]()
Scale AI 宣布已收集超過 10 萬小時的素材 https://scale.com/blog/physical-ai
這是人類歷史上第一次嘗試大規模地把身體知識外化。
波蘭尼說,默會知識不能被完全言說,但這不代表它不能被掠取。Couldry 和 Mejias 說,數據殖民主義把日常生活本身變成了一種資源,一種“就在那里,隨時可以被提取”的東西。現在,連在家鋪床這件事也被包含在內了。
人們常常把 AI 的沖擊描述為“機器會取代知識工作者”,但現在最普通、最不被算作技能的那些動作也在被采集。如果連這些都可以變成訓練數據,那“什么是人的勞動”這個問題,就不再是哲學思辨,而變成了一個非常實際的政治問題。
Zeus 是尼日利亞中部高地一座城市里的醫學生。他每天下班后把手機固定在額頭上,然后開始給自己的床鋪床單。
他說,他覺得這是“留下印記的機會”。他不覺得自己只是在被使用,他覺得自己在參與一件重要的事。
這也許是對的,但它同時并不妨礙另一件事,那就是他留下的那個印記,最終的形狀將是他自己鋪床動作的運動軌跡,由一家他叫不出名字的公司買走,用來訓練一臺他將來不一定負擔得起的機器。
波蘭尼說,所有的知識都是個人的,是由具體的人、在具體的處境里、通過具體的實踐產生的。把這種知識從人身上剝離出來,讓它在人離開之后繼續運轉,那么現在,人作為知識的承載者,究竟擁有什么?
這個問題現在還沒有答案。但它已經在尼日利亞的公寓里、印度的廚房里、菲律賓的院子里,以每小時 15 美元的價格,被悄悄地問著。
參考文獻
[1]https://www.technologyreview.com/2026/04/01/1134863/humanoid-data-training-gig-economy-2026-breakthrough-technology/
本文經授權轉載自APPSO(ID:appsolution),如需二次轉載請聯系原作者。歡迎轉發到朋友圈。
點個“小愛心”吧
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.