![]()
作者 | 貓貓頭
郵箱 | cathy@pingwest.com
a16z Speedrun SR006里有60家公司,57%做B2B。只有一家做Audio。我們和它的創始人Artin聊了45分鐘,發現它踩中的東西比看起來大得多。
信息卡 SUN — AI-native audio learning, built around youAI讓音頻內容的生成成本暴跌80倍,但沒有人把這件事變成一個主動為你服務的消費級學習產品。SUN做的是:用AI實時生成個性化音頻——播客、課程、深度講解——嵌入通勤、健身、家務等屏幕之外的日常場景。不需要上傳材料,不需要看屏幕,有持續記憶層。 團隊: Artin,前Walmart AI預測平臺負責人 · Amy,Amazon Music播客創始工程師 · Matt,前Sky9 Capital AI投資人 a16z Speedrun SR006 | Pre-seed | 該屆60家公司中唯一的Audio Consumer
a16z Speedrun第六屆剛剛收官。60家公司,57%是B2B。
Consumer只有7家。做Audio的,只有1家。
它叫SUN。三個人,坐標Sunnyvale,一個AI音頻學習應用。No screen, just your ears.
我和SUN的創始人Artin Bogdanov聊了45分鐘。順著這家公司往下挖,我們發現它踩中的東西,比大多數人意識到的要大得多。
![]()
1
一個筆記工具的意外爆發
先說一個看似無關的事。
2024年9月,Google給NotebookLM加了一個叫Audio Overview的功能——上傳一篇論文或一份財報,它生成一段兩個AI主持人互相討論的播客。
這個功能炸了。用戶開始把論文、合同、甚至日記喂進去,在TikTok和Twitter上分享"聽自己的論文變成播客"的片段。移動端上線幾個月,月活突破800萬——在部分時段的Google Trends熱度上,它甚至超過了Google自家旗艦大模型Gemini。
到2025年底,Audio Overview已支持超過80種語言,并開始測試"授課模式"(Lecture Mode)——不再是兩個人閑聊,而是一個AI講師給你上30分鐘深度課。a16z在《State of Consumer AI 2025》報告里直接將NotebookLM評為Google推出的最成功的創新產品界面。
一個原本做筆記的工具,因為加了音頻生成,變成了現象級應用。
這不是偶然。它釋放出一個信號:用戶對"用耳朵獲取信息"的需求,遠遠被低估了。
1
屏幕見頂,耳朵擴張
把視野拉遠,NotebookLM的爆發只是冰山一角。
美國成年人日均屏幕時間已達7小時2分鐘,但53%的人想減少手機使用,超過一半承認屏幕時間"完全沒有生產力"。用戶被算法綁在屏幕前7個小時,有一半覺得毫無價值。與此同時,Edison Research 2026年數據顯示2.33億美國人每月收聽在線音頻——72%的人聽音頻時在做其他事情,閱讀時這個比例只有32%。音頻不跟TikTok搶眼睛——它填滿了眼睛被占用但大腦仍有余力的所有暗時間:通勤、健身、做飯、做家務。這是一塊巨大的、被視覺媒體完全忽略的注意力市場。
制作端的變化同樣劇烈。2023年一部有聲書要3,420到7,650美元加8到12周,2026年用AI生成低于250美元、不到1小時——成本暴跌10到80倍。ElevenLabs拿到5億美元D輪、估值110億,a16z超額跟投4倍。AI配音有聲書已占新發行量的23%,非虛構類內容上AI音頻和人類錄制版的完播率、退貨率已無統計學差異。
屏幕見頂,耳朵擴張,成本崩潰,體驗過線。四條線同時交匯。
![]()
1
四十年懸而未決的問題
拉到教育場景里,故事更有張力。1984年,教育心理學家Benjamin Bloom證明了一件事:一對一輔導的學生成績比普通班級高出兩個標準差,但給每個學生配一個導師在經濟上不可能。四十年來,所有教育技術都停在了半路——直到2025年哈佛在Nature旗下發表隨機對照實驗,證明AI導師的學習增益直接逼近Bloom的黃金標準。AI導師有效。那最佳的交付形式是什么?BBC的神經科學研究發現,邊運動邊聽音頻的人比看屏幕的人長期記憶編碼高22%。音頻學習不是視覺學習的降級版——它讓人在生活的縫隙里持續學習。
1
和耶穌聊天
Artin不會跟你講這些論文。
他告訴我,在Walmart干了幾年之后——年營收超過6000億美元,230萬員工,全球收入第一的公司——他每天工作大約12個小時。他負責智能商業增長部門的預測平臺:如果Taylor Swift下周在Austin開演唱會,這家店要備多少卷廁紙?要排多少人上班?從下一個小時到未來五年,財務、運營、時間三個維度交叉預測。
回到家,他想讀圣經——66卷書,他的家庭是基督徒。但12個小時盯完屏幕后,眼睛痛得讀不下去。
于是他做了一件事:把圣經全部喂給AI,然后開始"和耶穌聊天"。問問題,聽耶穌講。后來耶穌開始給他上課。再后來,他把亞里士多德也加了進去。
"這就是SUN誕生的方式,"Artin說。"我相信音頻是最健康的信息攝取方式。"
![]()
1
從"預制品"到"定制品"
那SUN到底是什么?
傳統的音頻消費——播客、有聲書——是單向的、預錄的、為所有人做一份內容。聽一個四個半小時的播客有一段沒懂,你得暫停、離開、去別處找答案再回來。只有15分鐘通勤時間的人,四個半小時的播客根本不是選項。
SUN要做的是把音頻從"預制品"變成"定制品"。
你可以對它說:"生成一個60分鐘的Deep Dive播客,主題是怎么在a16z Demo Day上成功,針對舊金山的B2C應用。"它全網抓取最新信息,過濾過時內容,編織成一段有結構的音頻體驗——有時是一個講述者,有時是兩人辯論,有背景音樂和轉場。你隨時可以打斷、提問,它回答后繼續。
或者什么都不說,直接按播放。SUN有一個記憶層,它知道你是誰、你在哪個階段、你想成為什么樣的人,會主動推送內容。Artin告訴我,有一天他和投資人開完會,覺得在某個問題上有分歧但不想制造信任裂痕,回到辦公室后SUN推了一個三分鐘的音頻——主題是"如何獲得投資人的信任"。
"這就是魔法發生的時刻,"他說。"It's almost like a universal sense of timing."
Artin把這叫做"Audio TikTok, but without brain rot"——像TikTok一樣懂你,但不用多巴胺綁架你。
![]()
1
不要你看屏幕
我問Artin,SUN和其他學習產品的根本區別是什么。他沒講功能,講了哲學。
"我們活在注意力經濟里,"他說。"所有App都想要你的注意力。TikTok用多巴胺換你的時間——看吧,跟我玩你會有火花的。Duolingo呢?也是多巴胺,但它說我們給你的是好東西,因為你在學習——broccoli with chocolate topology,裹了巧克力的西蘭花。但本質上,它們都在說同一句話:給我你的注意力,看著屏幕。"
"SUN不要你看屏幕。We want to dissolve into your daily routine。我們不想改變你的生活節奏,不想讓你額外拿出時間做'學習會話'。通勤時聽,健身時聽,散步時聽。我們只是嵌入你已經在做的事情里。"
"用視頻做到這一點是不可能的,"他說。"視頻意味著你必須看著屏幕,必須保持那個姿勢。而我想讓你去體驗生活——go for a walk, go to the gym, be mobile——在路上學。It's like a voice in your ear that gives you information at the right time."
![]()
這段話背后是SUN和NotebookLM最本質的區別。NotebookLM是reactive的——你得先上傳數據集,它才能生成內容。它是一個工具,等著你喂東西。SUN是proactive的——它有持續的記憶層,每一次交互不是獨立的session,而是在你的長期畫像上不斷疊加。它不是幫你"做一次研究",而是持續性地推動你往你想去的方向走。
Artin花了一年給Forbes寫AI與產品設計交叉領域的文章,發展出一個核心觀點:大多數產品把太多選項堆在界面上,給用戶造成選擇癱瘓。AI的價值不是給你更多選項,而是用對你的理解來消除選項。
"Personalization is empathy,"他說。"真正的個性化就是共情。你真正理解用戶,就不需要給他十個選項讓他自己挑。"
1
幾乎沒有人的位置
在AI音頻學習這個賽道上,已有幾個名字。Speak拿到7800萬美元C輪、估值10億,做AI語言口語對練——但只做語言。PadhAI做考試備考的AI語音輔導,在印度拿到20萬用戶——但只做考試。YouLearn是YC孵化項目,把講義轉化成AI音頻導師——但需要你上傳材料。NotebookLM最接近SUN,但正如前文所述,它是reactive的——你必須給它喂數據,它才能生成內容。
值得注意的是,把這四個名字排在一起看,會發現一個規律:每個都在AI音頻的某個切面上做到了驗證,但每個都被自己的邊界卡住了——要么只做一個品類,要么只能被動響應,要么只能處理用戶已有的材料。
那個精確的空白地帶是什么?一個主動為你生成全品類個性化音頻學習內容的消費級產品——不限語言,不限考試,不需要上傳,有持續記憶層,能嵌入日常節奏。
這個位置上,幾乎沒有人。
![]()
SUN的團隊配置也值得單獨看一下。Artin來自Walmart的AI預測系統,做過從下一小時到未來五年的全維度商業預測。Amy是Amazon Music播客的創始工程師,在大平臺內部做了四年音頻產品——她知道大平臺為什么做不好這件事。Matt在Sky9 Capital做了兩年多AI項目投資和孵化,看過大量類似的idea之后選擇下場加入——一個VC選擇跳到創業這邊,通常意味著他看到了一個別人還沒看到的東西。
1
意外的用戶
對話快結束時,我問Artin有沒有意外的用戶——那種你沒預期到會出現的人。
他想了想,說了兩個。
一個是55歲的女性用戶。三個孩子,有工作,做家務的時候聽SUN。她告訴Artin:"我一直想繼續學習,但我沒有時間。現在做家務的時候在聽,終于可以了。"
Artin說他從沒想過要觸達這個群體。但這個案例讓他意識到一件事:定義用戶不一定從人口統計學出發,可以從"時間場景"出發——什么時候人們的耳朵是空閑的,但手和眼睛是忙碌的?做家務就是這樣一個窗口。由此反推:誰在做家務?可能是有大房子的家長,可能在德州或阿肯色,可能對育兒或個人興趣有學習需求。
另一個是ADHD用戶。她說音頻比文字更容易消化,SUN把內容切成短課程的方式幫她更容易完成學習。
這兩個案例指向同一件事:SUN真正在爭奪的不是某個人口畫像,而是某種時間狀態——身體在動、眼睛被占、大腦仍有余力的那些時刻。
Artin還提到了他的"Son Test"。他有一個三個月大的兒子。自從當了父親,他給產品加了一個新的KPI——一個極其二元的判斷標準:
"我愿不愿意讓我兒子每天用這個功能?"
"我永遠不會讓這個App變得讓人上癮,因為我不想讓我兒子產生依賴。如果某個功能我不愿意讓我兒子每天使用,那我也不愿意讓其他任何人使用。"
![]()
1
那個扶梯
在SR006的畫像里,SUN看起來是個異類——不是B2B,三個人,做Audio。但如果你把視角拉遠——NotebookLM 800萬月活、ElevenLabs 110億估值、音頻制作成本暴跌80倍、2.33億美國人每月聽在線音頻、哈佛RCT證明AI導師學習增益翻倍、BBC證明聽音頻比看屏幕記憶編碼高22%——SUN不是異類。它是早到了。
Speak做AI語言口語對練做到了10億估值。全品類的AI音頻學習,還沒有贏家。
我問Artin,SUN最終想改變什么——不是功能層面的,更大的那個東西。
他說SUN的使命是"幫你成長"。在入門引導的第一步,SUN問的是兩個問題:你今天在哪里?你想到哪里去?
"轉變是有距離的,你在這里,你想去那里。你知道機場里那種自動扶梯嗎?你可以站在上面不動,也可以走得飛快,但不管怎樣你都在前進。SUN就是那個扶梯。"
"在這個AI試圖替代你的時代,SUN試圖升級你。"
他停了一下。
"SUN is light. And light is nice."
![]()
點個“愛心”,再走 吧
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.