<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      25美分復(fù)刻o1推理:窮人的并行搜索方案

      0
      分享至

      第一次用OpenAI o1時,我拋給它一個刁鉆問題:"設(shè)計一個多區(qū)域、強一致的隊列,要能扛住整個AWS區(qū)域掛掉。"

      它停頓了十秒。然后給出一個精妙、謹慎、自我修正的答案。我服了。


      然后看了眼價格。還有速率限制。還有我完全看不到它為什么否決某些路徑的黑箱。

      這時候一個念頭冒出來——不是什么突破,而是一個老舊、無聊、美好的云架構(gòu)模式:Map-Reduce。

      AI實驗室不會告訴你的秘密:推理就是搜索,而搜索天生愛并行。

      你不需要o1。你需要50個廉價大模型并行跑,一個裁判,再加AWS Step Functions。

      單模型的困境

      單個LLM是個聰明的猜測者,但只有一槍機會。問它難題,它立刻開始吐token。第20個token stumble一下,整個答案就歪進溝里。

      o1的解法是"先想后說"——模擬多條內(nèi)部思維鏈。

      但訣竅在于:你不需要特殊模型來干這個。可以暴力推理——讓50個廉價模型的副本各試一種思路,再雇一個昂貴的裁判挑出最好的想法,縫合起來。

      這不是魔法。這是分布式計算。

      我叫它Scatter-Gather Reasoning(分散-收集推理)。

      架構(gòu)全在Serverless

      整套東西搭在AWS無服務(wù)器上。沒有Kubernetes,沒有常駐GPU。

      用戶問題進來,Step Functions的Distributed Map同時啟動50個Lambda。每個Lambda調(diào)Claude 3 Haiku(極便宜、極快),temperature設(shè)0.9。

      高溫意味著同樣提示詞產(chǎn)出 wildly different 的答案。一個Haiku可能提議Postgres隊列,另一個推SQS+DynamoDB,第三個可能幻覺出一個完全錯誤但有趣的方案。

      沒關(guān)系。我們要的就是多樣性。

      50個響應(yīng)在2-4秒內(nèi)落進S3桶。

      工人跑完后,Step Functions觸發(fā)單個Judge Lambda。它讀取全部50個答案,拼成一個巨型提示詞,發(fā)給Claude Sonnet 3.5(聰明得多,但更慢更貴),temperature壓到0.1。

      裁判的系統(tǒng)提示詞極其簡潔:

      "審閱這50個方案。明顯錯的扔掉。從幸存者里提取最強想法。然后合成一個單一、正確、生產(chǎn)就緒的答案。注明哪個工人貢獻了哪個想法。"

      Sonnet返回最終答案。用戶看到的是一個深思熟慮、推理嚴密的回應(yīng)——完全不知道背后有50個小模型壯烈犧牲。

      成本拆解

      按us-east-1 Bedrock現(xiàn)價算賬。單次硬查詢假設(shè):

      Haiku蜂群:(500輸入+1000輸出)×50 = 每個工人$0.00025 → 總計$0.068

      Sonnet裁判:輸入50,500 token → $0.15;輸出2,000 token → $0.03

      合計:約25美分。15秒內(nèi)跑完。

      作為對照,o1-preview按輸入長度不同,單次查詢成本在$0.60到$6.00之間。而且你還看不見它怎么想的。

      這方案不是什么

      不是o1替代品。o1在數(shù)學(xué)證明和代碼生成上仍然更強,它的內(nèi)部思維鏈針對特定推理任務(wù)做了優(yōu)化。

      但對我們這些需要解釋性、需要控制成本、需要知道答案從哪來的人來說,Scatter-Gather是個務(wù)實的中間地帶。

      你可以看到50個工人各自想了什么。可以調(diào)溫度、調(diào)數(shù)量、換模型。可以把裁判換成Gemini 1.5 Pro,或者本地Llama 3 70B。

      這是可審計的推理。開源的o1。

      關(guān)鍵設(shè)計決策

      為什么用Haiku當(dāng)工人?夠快夠便宜,幻覺率其實對發(fā)散搜索有利——我們要的是想法多樣性,不是每個都對。

      為什么50個?邊際收益遞減。測試顯示30個能抓到80%的好想法,50個到90%,再往上性價比崩掉。

      為什么S3做中間存儲?Step Functions狀態(tài)機有256KB限制,50個完整響應(yīng)塞不進去。S3便宜到忽略不計,而且方便調(diào)試時翻日志。

      為什么讓裁判引用工人編號?這是可解釋性的核心。用戶追問"為什么選DynamoDB全局表而不是Aurora Global",你能指認是Worker_17提出的,并回溯它的原始推理。

      實際跑起來的坑

      第一個版本用SQS做工人結(jié)果收集,踩了坑:SQS消息可見性超時和Lambda超時打架,導(dǎo)致部分結(jié)果重復(fù)處理。換成S3+Step Functions原生等待模式,可靠性提升一個數(shù)量級。

      Haiku的temperature 0.9在部分查詢上太瘋,會生成語法破碎的JSON。加了輸出格式強制:每個工人必須用指定JSON schema返回,否則自動重試一次。裁判收到格式錯誤的直接丟棄。

      Sonnet裁判的輸入token膨脹很快。50個工人各回1000 token,加上提示詞框架,輕松破5萬。早期用Claude 3 Opus當(dāng)裁判,輸入成本直接飆到$0.75,性價比崩塌。Sonnet 3.5是甜點。

      什么時候別用這套

      實時聊天場景不行,15秒延遲用戶受不了。需要確定性輸出的合規(guī)場景也不行,概率性搜索本質(zhì)不可復(fù)現(xiàn)。還有極度簡單的查詢——讓50個工人搶答"2+2",純粹浪費錢。

      最適合的是:復(fù)雜架構(gòu)設(shè)計、故障排查根因分析、需要多視角權(quán)衡的策略決策。也就是o1宣傳冊上寫的那些場景,只是你愿意用可解釋性和成本換可控性。

      下一步可以玩什么

      工人分層:10個Haiku做快速發(fā)散,10個Sonnet做深度推演,30個Haiku做邊界情況探索。成本漲一點,覆蓋度漲很多。

      遞歸Scatter-Gather:裁判的合成答案如果置信度不夠,自動觸發(fā)第二輪,針對薄弱環(huán)節(jié)再派50個工人深挖。

      模型異構(gòu):混用Claude、GPT-4o-mini、Gemini Flash當(dāng)工人,利用不同訓(xùn)練數(shù)據(jù)的盲區(qū)互補。

      但這些優(yōu)化都有個前提:先跑通基礎(chǔ)版。25美分一次,值得試試。

      代碼和CloudFormation模板我放在GitHub了。不是產(chǎn)品,是藍圖。按你的需求改,按你的預(yù)算調(diào)。

      云廠商花了二十年教我們:規(guī)模上去,單價下來。AI推理正在走同樣的路。o1是保時捷,Scatter-Gather是改裝思域——慢兩秒,但你知道引擎蓋下面每一顆螺絲在哪。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      眼紅啊!南寧一教師月薪14044元的截圖引熱議,網(wǎng)友:副高五級吧

      眼紅啊!南寧一教師月薪14044元的截圖引熱議,網(wǎng)友:副高五級吧

      火山詩話
      2026-05-06 07:43:22
      特斯拉上海產(chǎn)Model 3換芯:充電功率漲47%,加速快0.9秒

      特斯拉上海產(chǎn)Model 3換芯:充電功率漲47%,加速快0.9秒

      字節(jié)漫游指南
      2026-05-08 13:41:30
      全球十大反美國家,3個倒下2個投降,剩下五個還能撐多久?

      全球十大反美國家,3個倒下2個投降,剩下五個還能撐多久?

      番外行
      2026-05-08 08:37:37
      《教父》柯里昂臨終前的頓悟:男人可以囂張,可以蠻橫,可以得罪權(quán)貴,唯獨這兩類人,碰了就是給自己種下禍端

      《教父》柯里昂臨終前的頓悟:男人可以囂張,可以蠻橫,可以得罪權(quán)貴,唯獨這兩類人,碰了就是給自己種下禍端

      心理觀察局
      2026-05-08 09:32:04
      中國境內(nèi)唯一一支外國軍隊,趕了50年趕不走,至今仍駐扎在北京

      中國境內(nèi)唯一一支外國軍隊,趕了50年趕不走,至今仍駐扎在北京

      可樂愛微笑
      2026-05-07 02:35:38
      老板娘問我她大不大?我該怎么回答?

      老板娘問我她大不大?我該怎么回答?

      太急張三瘋
      2026-05-08 14:40:08
      揣100塊去朝鮮揮金如土?游客笑了導(dǎo)游哭了:這錢夠我全家活10天

      揣100塊去朝鮮揮金如土?游客笑了導(dǎo)游哭了:這錢夠我全家活10天

      老特有話說
      2026-05-08 13:23:10
      司法部:“掃碼入企”全面推行!無“執(zhí)法碼”不得檢查

      司法部:“掃碼入企”全面推行!無“執(zhí)法碼”不得檢查

      每日經(jīng)濟新聞
      2026-05-08 12:01:51
      德國“白左”狂歡:斬斷能源自掘墳?zāi)?>
    </a>
        <h3>
      <a href=小眼睛小世界
      2026-05-07 06:21:41
      23歲女子花139元報名徒步,因身體不適獨自返回途中猝死!旅行社稱有“免責(zé)聲明”,法院:不能免責(zé),需承擔(dān)30%責(zé)任

      23歲女子花139元報名徒步,因身體不適獨自返回途中猝死!旅行社稱有“免責(zé)聲明”,法院:不能免責(zé),需承擔(dān)30%責(zé)任

      封面新聞
      2026-05-08 10:34:21
      別輕視小人物:20個歷史血淚教訓(xùn),強者多亡于螻蟻

      別輕視小人物:20個歷史血淚教訓(xùn),強者多亡于螻蟻

      小莜讀史
      2026-05-06 20:15:38
      核桃立功!國際頂刊證實:可降低全身炎癥,4周壽命延長45%

      核桃立功!國際頂刊證實:可降低全身炎癥,4周壽命延長45%

      果殼
      2026-05-06 16:11:57
      9季度虧掉207億,李東生還不認輸

      9季度虧掉207億,李東生還不認輸

      中國企業(yè)家雜志
      2026-05-08 10:16:42
      2026事業(yè)單位檔案倒查來了,這次動真格!

      2026事業(yè)單位檔案倒查來了,這次動真格!

      細說職場
      2026-05-07 17:12:28
      月薪幾萬卻招不到人?遠洋海員背后的殘酷,配偶:男女關(guān)系太亂了

      月薪幾萬卻招不到人?遠洋海員背后的殘酷,配偶:男女關(guān)系太亂了

      李將平老師
      2026-05-08 09:42:27
      16歲女生玩秋千墜亡后續(xù):多視角曝光,死因非沒綁緊,細節(jié)披露

      16歲女生玩秋千墜亡后續(xù):多視角曝光,死因非沒綁緊,細節(jié)披露

      李晚書
      2026-05-06 13:21:59
      吳宜澤奪冠爆火,因籍貫問題引兩省網(wǎng)友爭論,姐姐給出了準確回應(yīng)

      吳宜澤奪冠爆火,因籍貫問題引兩省網(wǎng)友爭論,姐姐給出了準確回應(yīng)

      胡一舸南游y
      2026-05-07 20:39:43
      全身愛馬仕的馬筱梅生完孩子卻改穿三百塊抖音套裝

      全身愛馬仕的馬筱梅生完孩子卻改穿三百塊抖音套裝

      小邵說劇
      2026-05-08 14:12:34
      在西藏遇到白色帳篷,為啥要躲著?老牧民直言:進去誰也幫不了你

      在西藏遇到白色帳篷,為啥要躲著?老牧民直言:進去誰也幫不了你

      抽象派大師
      2026-05-07 00:28:27
      日本高層訪華無果后,不甘心的高市決定親自訪華,中方態(tài)度堅決

      日本高層訪華無果后,不甘心的高市決定親自訪華,中方態(tài)度堅決

      瀲滟晴方DAY
      2026-05-08 05:03:41
      2026-05-08 16:48:49
      閃存獵手
      閃存獵手
      全網(wǎng)蹲好價的野生捕手,算力與羊毛都不可辜負。
      2280文章數(shù) 21關(guān)注度
      往期回顧 全部

      科技要聞

      SK海力士平均獎金600萬 工服成相親神器

      頭條要聞

      沙特翻臉突然對美軍關(guān)閉領(lǐng)空 特朗普連忙打電話都沒用

      頭條要聞

      沙特翻臉突然對美軍關(guān)閉領(lǐng)空 特朗普連忙打電話都沒用

      體育要聞

      他把首勝讓給隊友,然后用一年時間還清賬單

      娛樂要聞

      古天樂被曝隱婚生子,新娘竟是她

      財經(jīng)要聞

      一覺醒來,美伊又打起來了

      汽車要聞

      智能雙艙大五座SUV 樂道L80將于5月15日正式上市

      態(tài)度原創(chuàng)

      本地
      游戲
      時尚
      親子
      藝術(shù)

      本地新聞

      用蘇繡的方式,打開江西婺源

      外媒稱Switch 2虧本銷售,任天堂壓力很大

      海魂衫搭配白色,更解暑!

      親子要聞

      警惕!身邊這些東西可能讓孩子早熟

      藝術(shù)要聞

      探索施密德的油畫,感受無法抵擋的藝術(shù)魅力!

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 亚洲中文字幕久爱亚洲伊人| 老熟妇高潮偷拍一区二区| 亚洲成a人片在线观看88| 性少妇xx| xxx综合网| 黄色一级片在线观看| 亚洲欧美日本久久网站| 国产va精品| 人妻中文网| 欧美 日韩 人妻 高清 中文| 小辣椒福利视频导航| 欧美国产日韩久久mv| 一区二区国产高清视频在线| 亚洲第一福利视频| 综合福利导航| 欧美目本| 久久综合九色综合97_%20久久久| 亚洲色欲色欱WWW在线| 丝袜精品字幕| 试看120秒一区二区三区| 久久本道久久综合伊人 | 国产成人久久777777| 国产高清又黄又嫩的免费视频网站 | 久久三级久久国产| 久久国产精品久久精品| 69天堂人成无码免费视频| 粉嫩一区二区三区色综合| 色77777| 靖安县| 亚洲国产精品黄在线观看| 无码精品黑人| 日本久久激情| 男人精品一区二区三区| 国产真实乱人偷精品人妻| 精品国产99久久久久久www| 911亚洲国产自产| 久久99国产综合精品1| 午夜日韩久久影院| 亚洲精品宾馆在线精品酒店| aⅴ天堂αv国产| 亚洲a∨无码精品色午夜|