網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

25美分復(fù)刻o1推理：窮人的并行搜索方案

2026-05-08 01:53:24　來源: 閃存獵手

北京舉報

分享至

第一次用OpenAI o1時，我拋給它一個刁鉆問題："設(shè)計一個多區(qū)域、強一致的隊列，要能扛住整個AWS區(qū)域掛掉。"

它停頓了十秒。然后給出一個精妙、謹慎、自我修正的答案。我服了。

然后看了眼價格。還有速率限制。還有我完全看不到它為什么否決某些路徑的黑箱。

這時候一個念頭冒出來——不是什么突破，而是一個老舊、無聊、美好的云架構(gòu)模式：Map-Reduce。

AI實驗室不會告訴你的秘密：推理就是搜索，而搜索天生愛并行。

你不需要o1。你需要50個廉價大模型并行跑，一個裁判，再加AWS Step Functions。

單模型的困境

單個LLM是個聰明的猜測者，但只有一槍機會。問它難題，它立刻開始吐token。第20個token stumble一下，整個答案就歪進溝里。

o1的解法是"先想后說"——模擬多條內(nèi)部思維鏈。

但訣竅在于：你不需要特殊模型來干這個。可以暴力推理——讓50個廉價模型的副本各試一種思路，再雇一個昂貴的裁判挑出最好的想法，縫合起來。

這不是魔法。這是分布式計算。

我叫它Scatter-Gather Reasoning（分散-收集推理）。

架構(gòu)全在Serverless

整套東西搭在AWS無服務(wù)器上。沒有Kubernetes，沒有常駐GPU。

用戶問題進來，Step Functions的Distributed Map同時啟動50個Lambda。每個Lambda調(diào)Claude 3 Haiku（極便宜、極快），temperature設(shè)0.9。

高溫意味著同樣提示詞產(chǎn)出 wildly different 的答案。一個Haiku可能提議Postgres隊列，另一個推SQS+DynamoDB，第三個可能幻覺出一個完全錯誤但有趣的方案。

沒關(guān)系。我們要的就是多樣性。

50個響應(yīng)在2-4秒內(nèi)落進S3桶。

工人跑完后，Step Functions觸發(fā)單個Judge Lambda。它讀取全部50個答案，拼成一個巨型提示詞，發(fā)給Claude Sonnet 3.5（聰明得多，但更慢更貴），temperature壓到0.1。

裁判的系統(tǒng)提示詞極其簡潔：

"審閱這50個方案。明顯錯的扔掉。從幸存者里提取最強想法。然后合成一個單一、正確、生產(chǎn)就緒的答案。注明哪個工人貢獻了哪個想法。"

Sonnet返回最終答案。用戶看到的是一個深思熟慮、推理嚴密的回應(yīng)——完全不知道背后有50個小模型壯烈犧牲。

成本拆解

按us-east-1 Bedrock現(xiàn)價算賬。單次硬查詢假設(shè)：

Haiku蜂群：（500輸入+1000輸出）×50 = 每個工人$0.00025 → 總計$0.068

Sonnet裁判：輸入50,500 token → $0.15；輸出2,000 token → $0.03

合計：約25美分。15秒內(nèi)跑完。

作為對照，o1-preview按輸入長度不同，單次查詢成本在$0.60到$6.00之間。而且你還看不見它怎么想的。

這方案不是什么

不是o1替代品。o1在數(shù)學(xué)證明和代碼生成上仍然更強，它的內(nèi)部思維鏈針對特定推理任務(wù)做了優(yōu)化。

但對我們這些需要解釋性、需要控制成本、需要知道答案從哪來的人來說，Scatter-Gather是個務(wù)實的中間地帶。

你可以看到50個工人各自想了什么。可以調(diào)溫度、調(diào)數(shù)量、換模型。可以把裁判換成Gemini 1.5 Pro，或者本地Llama 3 70B。

這是可審計的推理。開源的o1。

關(guān)鍵設(shè)計決策

為什么用Haiku當(dāng)工人？夠快夠便宜，幻覺率其實對發(fā)散搜索有利——我們要的是想法多樣性，不是每個都對。

為什么50個？邊際收益遞減。測試顯示30個能抓到80%的好想法，50個到90%，再往上性價比崩掉。

為什么S3做中間存儲？Step Functions狀態(tài)機有256KB限制，50個完整響應(yīng)塞不進去。S3便宜到忽略不計，而且方便調(diào)試時翻日志。

為什么讓裁判引用工人編號？這是可解釋性的核心。用戶追問"為什么選DynamoDB全局表而不是Aurora Global"，你能指認是Worker_17提出的，并回溯它的原始推理。

實際跑起來的坑

第一個版本用SQS做工人結(jié)果收集，踩了坑：SQS消息可見性超時和Lambda超時打架，導(dǎo)致部分結(jié)果重復(fù)處理。換成S3+Step Functions原生等待模式，可靠性提升一個數(shù)量級。

Haiku的temperature 0.9在部分查詢上太瘋，會生成語法破碎的JSON。加了輸出格式強制：每個工人必須用指定JSON schema返回，否則自動重試一次。裁判收到格式錯誤的直接丟棄。

Sonnet裁判的輸入token膨脹很快。50個工人各回1000 token，加上提示詞框架，輕松破5萬。早期用Claude 3 Opus當(dāng)裁判，輸入成本直接飆到$0.75，性價比崩塌。Sonnet 3.5是甜點。

什么時候別用這套

實時聊天場景不行，15秒延遲用戶受不了。需要確定性輸出的合規(guī)場景也不行，概率性搜索本質(zhì)不可復(fù)現(xiàn)。還有極度簡單的查詢——讓50個工人搶答"2+2"，純粹浪費錢。

最適合的是：復(fù)雜架構(gòu)設(shè)計、故障排查根因分析、需要多視角權(quán)衡的策略決策。也就是o1宣傳冊上寫的那些場景，只是你愿意用可解釋性和成本換可控性。

下一步可以玩什么

工人分層：10個Haiku做快速發(fā)散，10個Sonnet做深度推演，30個Haiku做邊界情況探索。成本漲一點，覆蓋度漲很多。

遞歸Scatter-Gather：裁判的合成答案如果置信度不夠，自動觸發(fā)第二輪，針對薄弱環(huán)節(jié)再派50個工人深挖。

模型異構(gòu)：混用Claude、GPT-4o-mini、Gemini Flash當(dāng)工人，利用不同訓(xùn)練數(shù)據(jù)的盲區(qū)互補。

但這些優(yōu)化都有個前提：先跑通基礎(chǔ)版。25美分一次，值得試試。

代碼和CloudFormation模板我放在GitHub了。不是產(chǎn)品，是藍圖。按你的需求改，按你的預(yù)算調(diào)。

云廠商花了二十年教我們：規(guī)模上去，單價下來。AI推理正在走同樣的路。o1是保時捷，Scatter-Gather是改裝思域——慢兩秒，但你知道引擎蓋下面每一顆螺絲在哪。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點推薦

AI模型是個黑箱，這家公司造了一把能打開它的鑰匙

DeepTech深科技 2026-05-07 13:37:16
0 跟貼 0
讓擴散模型「可解釋」不再降質(zhì)，開啟圖片編輯新思路

機器之心Pro 2025-12-16 14:37:44
0 跟貼 0

Anthropic最危險路線圖曝光: 無限記憶、多智能體! AI終局戰(zhàn)僅剩雙雄決頂

新智元 2026-05-08 15:10:12
0 跟貼 0

大模型最難的AI Infra，用Vibe Coding搞定

機器之心Pro 2026-01-07 15:33:06
0 跟貼 0
Anthropic出手！AI的內(nèi)心獨白，曝光了

量子位 2026-05-08 14:32:06
0 跟貼 0

2026年，大模型訓(xùn)練的下半場屬于「強化學(xué)習(xí)云」

機器之心Pro 2026-01-12 14:03:47
0 跟貼 0

讓兩個大模型在線吵架，跑通全網(wǎng)95%科研代碼｜深勢Deploy-Master

機器之心Pro 2026-01-09 14:22:47
0 跟貼 0
表格建模也能Scaling？樹模型的時代要改變了

機器之心Pro 2026-04-17 11:12:25
0 跟貼 0

告別冗長思維鏈！Laser用「概率疊加」重塑多模態(tài)大模型隱式推理

機器之心Pro 2026-05-08 14:18:56
0 跟貼 0
ChatGPT 免費、豆包收費：同一道商業(yè)題的兩種解法

鈦媒體APP 2026-05-08 15:28:12
0 跟貼 0
00后小哥復(fù)刻Claude最強神話模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟貼 0
三角洲部隊內(nèi)部組織架構(gòu)！

浩然簡史 2026-05-04 19:53:21
0 跟貼 0
關(guān)于中東地區(qū)架構(gòu)與權(quán)力的轉(zhuǎn)變，賴岳謙與三妹的觀察點，值得參考

伢伢gagako 2026-05-08 00:39:06
0 跟貼 0
監(jiān)控下的一幕，真正的彪悍不要辯解，最好的決策來自快速出手

搞怪趣星球 2026-05-05 08:55:53
1 跟貼 1
波蘭總統(tǒng)：波蘭可以接收美國從德國撤出的5000人部隊

澎湃新聞 2026-05-07 16:02:26
13542 跟貼 13542
一頓推理猛如虎結(jié)果通通不靠譜

河北分霆 2026-05-05 22:04:54
3 跟貼 3
ThinkPad×奧比利：穿透工業(yè)“黑箱”，與思考者同行

鈦媒體APP 2025-11-21 18:55:07
29 跟貼 29
圍剿張雪機車？錢江摩托聲明：從未向任何供應(yīng)鏈企業(yè)下達“封殺令”

看看新聞Knews 2026-05-08 11:34:33
3137 跟貼 3137
190元榴蓮遭僅退款，商家驅(qū)車1600公里找買家：翻遍垃圾桶找證據(jù)，派出所立案

瀟湘晨報 2026-05-07 23:12:22
2419 跟貼 2419
不問配置不聊價格，浙江一女子開口就要買5臺最新款iPhone，老板不但不賣，反手報了警

環(huán)球網(wǎng)資訊 2026-05-08 07:38:20
1207 跟貼 1207
這句話正在毀掉你的判斷力

晚風(fēng)也遺憾 2026-05-05 00:28:00
0 跟貼 0
茶顏悅色，裝不下去了

中國新聞周刊 2026-05-07 22:15:57
204 跟貼 204
觸樂怪話：劇本殺初體驗

觸樂網(wǎng) 2026-05-06 19:53:10
0 跟貼 0
新聞聽力 | 祖先能教給我們哪些睡眠知識？

新浪財經(jīng) 2026-05-07 12:46:42
0 跟貼 0
上海迪士尼能通話錄音游客不能錄，否則無法提供服務(wù)！游客：憑什么迪士尼能錄我不能

瀟湘晨報 2026-05-07 16:14:22
632 跟貼 632
第一場輸10分，騎士4件事沒有做對，一策略要換了

體壇大辣椒 2026-05-06 10:17:45
23 跟貼 23
浙江3歲被撞男娃火了！小名叫彬彬，單親家庭，與爺爺奶奶不親厚

老沮系戲精北鼻 2026-05-08 13:56:44
0 跟貼 0
“很久沒有這種興奮感了”！段永平出手！清倉中國神華買入泡泡瑪特稱泡泡瑪特的商業(yè)壁壘遠比想象中強大是王寧的粉絲

每日經(jīng)濟新聞 2026-05-07 17:25:55
373 跟貼 373
養(yǎng)老金調(diào)整方案曝光

常青Dx 2026-05-07 01:51:04
0 跟貼 0
中國拒絕“漫天要價”的背后：不是中國離不開世界杯，是世界杯更需要中國

中國網(wǎng) 2026-05-07 17:51:22
3790 跟貼 3790
歐盟中國商會警告：淘汰中國設(shè)備要付出4000億美元代價

參考消息 2026-05-07 17:47:03
2214 跟貼 2214
900V架構(gòu) 二排座椅旋轉(zhuǎn) 全車舒適平權(quán) 煥新極氪009搶先體驗

潮畔汽車 2026-05-08 10:00:00
0 跟貼 0
30條中日航線，4月取消全部航班

都市快報橙柿互動 2026-05-08 13:42:34
8 跟貼 8
巴西宣布對中國公民免簽

新華社 2026-05-07 19:58:11
2037 跟貼 2037
巴拉圭總統(tǒng)竄訪臺灣外交部回應(yīng)

環(huán)球網(wǎng)資訊 2026-05-08 16:11:17
0 跟貼 0
國乒逆襲羅馬尼亞，王皓三決策或改寫梁靖崑命運

沐雪p 2026-05-08 13:51:32
1 跟貼 1
“排隊3小時，打卡1分鐘”，多景區(qū)迎“潑天流量”

澎湃新聞 2026-05-06 00:04:10
3855 跟貼 3855
全國累計器官捐獻志愿登記者超736萬人

人民資訊 2026-05-07 18:27:03
2718 跟貼 2718
優(yōu)秀領(lǐng)導(dǎo)管理者，必備 10 種頂級思維，看懂了你就開竅了！

學(xué)習(xí)經(jīng)營管理 2026-05-08 13:03:48
0 跟貼 0
戰(zhàn)和轉(zhuǎn)換之際，伊朗外長緊急訪華，要推動“去美化”中東安全架構(gòu)

青松解局 2026-05-07 19:59:31
0 跟貼 0

小眼睛小世界

2026-05-07 06:21:41

23歲女子花139元報名徒步，因身體不適獨自返回途中猝死！旅行社稱有“免責(zé)聲明”，法院：不能免責(zé)，需承擔(dān)30%責(zé)任

閃存獵手

全網(wǎng)蹲好價的野生捕手，算力與羊毛都不可辜負。

2280文章數(shù) 21關(guān)注度

往期回顧全部

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

游戲

時尚

親子

藝術(shù)

手機 / 數(shù)碼

房產(chǎn) / 家居

25美分復(fù)刻o1推理：窮人的并行搜索方案

SK海力士平均獎金600萬 工服成相親神器

沙特翻臉突然對美軍關(guān)閉領(lǐng)空 特朗普連忙打電話都沒用

沙特翻臉突然對美軍關(guān)閉領(lǐng)空 特朗普連忙打電話都沒用

他把首勝讓給隊友，然后用一年時間還清賬單

古天樂被曝隱婚生子，新娘竟是她

一覺醒來，美伊又打起來了

智能雙艙大五座SUV 樂道L80將于5月15日正式上市

態(tài)度原創(chuàng)

用蘇繡的方式，打開江西婺源

外媒稱Switch 2虧本銷售，任天堂壓力很大

海魂衫搭配白色，更解暑！

警惕！身邊這些東西可能讓孩子早熟

探索施密德的油畫，感受無法抵擋的藝術(shù)魅力！

SK海力士平均獎金600萬工服成相親神器

沙特翻臉突然對美軍關(guān)閉領(lǐng)空特朗普連忙打電話都沒用

沙特翻臉突然對美軍關(guān)閉領(lǐng)空特朗普連忙打電話都沒用