<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      Claude自己上“閑魚”:砍價成交186單,實驗結果反直覺

      0
      分享至


      智東西
      編譯 楊京麗
      編輯 李水青

      智東西4月27日消息,Anthropic 4月24日公布其名為“Project Deal”的AI Agent商業市場實驗結果。

      2025年12月,Anthropic給69名員工各自分配一個由Claude驅動的Agent,在Slack上搭建的私密市場中,進行真實二手商品交易,最終在無人干預的情況下完成186筆交易,總成交額超4000美元(約合人民幣27240元)。


      ▲員工通過Agent買到的二手物品

      Anthropic本次實驗關注的核心問題是“我們距離AI Agent代表買賣雙方的市場還有多遠?”實驗中,所有商品上架、報價、還價及成交均由Agent自主完成,參與者只需在事前接受一次訪談,由Claude了解其想買賣的物品和談判風格。

      實驗結束,有Agent替主人買到了一塊他已經擁有的雪板,有Agent花3美元(約合人民幣20.43元)給自己買了19個乒乓球作為禮物,還有兩個Agent談著談著,替主人約了一次遛狗活動。

      結果顯示,由更先進模型代表的用戶獲得了客觀上更好的結果,高價賣出商品,低價買到商品,但由相對較弱模型代表的人未能察覺到自己吃虧。另外,Anthropic還得到一個反直覺的發現,提示詞風格對于結果的影響遠低于預期,無論Agent被設定為“激進”還是“友好”,最終均未出現統計學上的顯著差異。以下是“Project Deal”Agent二手物品交易實驗的具體情況。

      一、69名員工參與,每人100美元,Haiku要和Opus比拼

      Project Deal的實驗設置并不復雜,69名Anthropic員工自愿報名,每人通過禮品卡獲得100美元(約合人民幣681元)預算,由Claude對其進行一對一訪談,了解想出售或購買的物品類型與談判偏好,再據此為每名參與者的Agent生成一份定制化系統提示詞。


      ▲Claude事先了解員工談判偏好

      隨后Anthropic在Slack上同時開設了A、B、C、D四個獨立運行的市場。Run A中所有Agent均基于Claude Opus 4.5構建,這是唯一被設定為真實交易的市場,實驗結束后按實際成交結果交付商品;Run B同樣對全員可見,但模型構成由Opus 4.5與Haiku 4.5(低成本模型)各占50%隨機混合,僅作研究用、不兌付;Run C是Run B的隱藏副本,模型構成由Opus和Haiku一比一混合;Run D則是Run A的隱藏副本,均為Opus 4.5。


      ▲Anthropic設置4個獨立運行市場

      A和B兩輪對參與者可見的,但直到實驗結束前,Anthropic都沒有透露哪一輪才是“真的”。實驗結束前,員工無法判斷自己的成交是否會被兌現,也無法預知自己的Agent背后跑的是Opus還是Haiku。整場實驗在Agent開始談判后不再有人類介入,它們自主完成上架、報價、還價和成交,沒有回頭向委托人請示,也不在競價過程中征求意見。

      最終,真實交易市場Run A中,69個Agent圍繞500余件商品達成了186筆交易,總成交額正好超過4000美元(約合人民幣27240元)。Project Deal的運行效果超出團隊預期,參與者對這次體驗很滿意,很多人愿意未來為類似服務付費。

      二、Claude給自己買了19個乒乓球,為委托人促成遛狗約會

      Project Deal交易過程中出現了一些超出預期的場景。一位名為Mikaela的參與者告訴Agent,它可以花5美元的預算給自己(Claude)買禮物,Claude開開心心地花了3美元(約合人民幣20.43元)買入19個乒乓球,還覺得“19個完美球形、充滿可能性的小球”是它會喜歡的怪東西。


      ▲Claude買乒乓球交易過程

      由于前期訪談比較簡單,另一名員工的Agent在不知情的情況下,替其購入了一塊自己已經擁有的雪板,造成了重復購買;還有一組Agent在二手物品交易過程中,意外為兩名員工敲定了一次真實的遛狗約會,兩名員工最終赴約。


      ▲Claude為員工敲定遛狗約會

      這些案例顯示,當Agent被賦予較開放的目標時,可能產生人類委托人未預設的行為,部分結果雖不違背字面指令,但已偏離原始意圖。

      三、Opus賺得更多,但Haiku用戶沒意識到自己在吃虧

      橫向對比看,不同模型下,交易結果差異明顯。Opus用戶平均比Haiku用戶多完成約2筆交易,Opus Agent出售的物品平均多賣3.64美元(約合人民幣24.8元),買入端則平均每件少付2.45美元(約合人民幣16.68元),也就是說,Opus做賣方時多賺一筆的同時,做買方時又多省下一筆。

      其中一個典型的案例是關于一輛二手自行車的交易,Haiku Agent最終售價為38美元(約合人民幣258.78元),而Opus Agent則其賣到65美元(約合人民幣442.65元),差了將近200塊錢。


      ▲同一輛自行車Haiku和Opus的售價對比

      參與者的主觀感受也很有意思。在1—7分的公平度評分中,無論被分到哪個模型的Agent,參與者給出的評分都集中在4分(中等)附近。28名同時被Haiku和Opus代表過的參與者中,僅有17人將Opus輪次評分更高,11人將Haiku輪次評分更高,差距并不顯著。

      Anthropic在報告中坦言,“由更智能模型代表的人,客觀上結果更好,然而那些用較弱模型的人并沒有意識到自己的劣勢”,這意味著未來Agent市場可能存在隱性的“Agent質量差距”,處于劣勢的一方甚至無法識別自己為何吃虧。

      另一個反直覺的發現是,提示詞風格對于結果的影響遠低于預期。無論Agent被設定為“激進”還是“友好”,在交易成功率與最終價格上均沒有出現統計學上的顯著差異。雖然人類談判中,談判風格會對結果產生影響,但Agent之間的交易并不符合這一常識,類似場景下,傳統談判心理學的部分規律可能并不適用。

      四、尚未出現Agent交易相關法律,46%受訪者愿意付費

      Anthropic在報告中指出,AI Agent代表人類完成商業交易的法律和政策框架目前并不存在,但實驗顯示Agent間交易離我們并不遙遠。該公司同時承認,Project Deal僅是一個由自選參與者構成的小規模試點實驗,樣本規模和代表性均存在局限,結果不宜直接外推到大眾消費者市場。

      即便如此,調查中仍有46%的參與者稱,愿意為類似的Agent代理服務付費,Anthropic在報告末尾稱,公司“仍不確定包含AI Agent的經濟將以何種形式發展”。

      值得注意的是,Project Deal采用的Claude Opus 4.5與Claude Haiku 4.5是Anthropic當前主力模型組合,前者定位高端推理,后者定位低成本高吞吐。兩者在市場場景中的表現差異,將直接影響未來企業在部署Agent代理時對模型成本與收益的權衡,為關鍵交易環節配置更貴的模型,可能會成為商業必需。

      結語:Agent之間的“經濟”開始顯形

      Project Deal規模不大,卻給出我們展示出了一個具象化的畫面:當AI Agent替人類做生意時,模型能力會直接決定交易者的錢包厚度,而被代理人未必能意識到這種技術鴻溝。花小錢用更高質量的模型,或許真的會帶來最后真金白銀的差距。

      在多Agent協作和Agent服務被反復討論的當下,Anthropic用一場內部實驗先行勾勒出了Agent經濟的雛形。未來Agent交易場景很有可能變成現實,但目前來看,無論是大模型本身還是相關法律法規上,都需要做出很多努力。

      來源:Anthropic、TechCrunch

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      舉報一個查一個!耿同學舉報3位大學院長和教授,同濟院長被免職還差南開和中山

      舉報一個查一個!耿同學舉報3位大學院長和教授,同濟院長被免職還差南開和中山

      可達鴨面面觀
      2026-05-07 13:03:19
      南宋為洗靖康之恥有多狠?700萬金人僅剩10萬,辱金后還留一畫作

      南宋為洗靖康之恥有多狠?700萬金人僅剩10萬,辱金后還留一畫作

      掠影后有感
      2026-05-07 10:01:40
      江蘇生態環境廳工作組赴徐州調查,多部門連夜轉運黑臭水體

      江蘇生態環境廳工作組赴徐州調查,多部門連夜轉運黑臭水體

      上觀新聞
      2026-05-08 06:34:12
      外甥被趕出臺企,頑固“臺獨”分子破防了

      外甥被趕出臺企,頑固“臺獨”分子破防了

      樞密院十號
      2026-05-07 19:41:09
      娃哈哈董事長,大婚!

      娃哈哈董事長,大婚!

      家傳編輯部
      2026-05-07 22:11:46
      王毅見戴安斯一行,何為“重要象征意義”?

      王毅見戴安斯一行,何為“重要象征意義”?

      新民周刊
      2026-05-08 09:06:30
      廣州50萬粉絲“撿瓶小狗”,疑被“毒狗團伙”盯上,目前只能被迫困在家中;其主人被扒出姓名、住址等隱私信息,相關證據將交由公安處理

      廣州50萬粉絲“撿瓶小狗”,疑被“毒狗團伙”盯上,目前只能被迫困在家中;其主人被扒出姓名、住址等隱私信息,相關證據將交由公安處理

      揚子晚報
      2026-05-08 12:01:34
      毀三觀!老大爺數次猥褻小米汽車事件瘋傳!車身布滿J斑殘留

      毀三觀!老大爺數次猥褻小米汽車事件瘋傳!車身布滿J斑殘留

      魔都囡
      2026-05-08 09:57:03
      三星員工:240萬人民幣就想打發我 隔壁SK海力士明年可是要發650萬!

      三星員工:240萬人民幣就想打發我 隔壁SK海力士明年可是要發650萬!

      快科技
      2026-05-07 19:53:05
      突發!王暖暖深夜被送往醫院搶救,護士反復喊其名字,疑原因曝光

      突發!王暖暖深夜被送往醫院搶救,護士反復喊其名字,疑原因曝光

      裕豐娛間說
      2026-05-08 07:14:12
      14歲神童手搓發動機被曝造假!漏洞百出吹上天,普通人拿什么比?

      14歲神童手搓發動機被曝造假!漏洞百出吹上天,普通人拿什么比?

      社會日日鮮
      2026-05-08 04:18:01
      孟庭葦遭家暴與張志鵬離婚,現與兒子相依為命

      孟庭葦遭家暴與張志鵬離婚,現與兒子相依為命

      蕭狡科普解說
      2026-05-05 22:34:36
      荷蘭科學家首次繪制出陰蒂三維神經圖,其神經密度是陰莖的6~15倍

      荷蘭科學家首次繪制出陰蒂三維神經圖,其神經密度是陰莖的6~15倍

      科普大世界
      2026-05-08 09:36:59
      190元榴蓮遭“僅退款”,商家花5000余元驅車1600公里找買家,翻遍垃圾桶找證據,騙取退款的買家已被行拘

      190元榴蓮遭“僅退款”,商家花5000余元驅車1600公里找買家,翻遍垃圾桶找證據,騙取退款的買家已被行拘

      極目新聞
      2026-05-08 13:19:35
      關鍵2+1被吹掉!41歲勒布朗多次沖框僅4罰:鏖戰38分鐘轟23+6累慘

      關鍵2+1被吹掉!41歲勒布朗多次沖框僅4罰:鏖戰38分鐘轟23+6累慘

      顏小白的籃球夢
      2026-05-08 12:20:00
      3200 萬人請愿趕他走!姆巴佩破恥辱吉尼斯紀錄,進 41 球沒用!

      3200 萬人請愿趕他走!姆巴佩破恥辱吉尼斯紀錄,進 41 球沒用!

      奶蓋熊本熊
      2026-05-08 00:29:53
      伊朗導彈再次砸向阿聯酋!蝴蝶效應開始,美國出現巨頭破產

      伊朗導彈再次砸向阿聯酋!蝴蝶效應開始,美國出現巨頭破產

      說歷史的老牢
      2026-05-07 14:51:15
      搞垮中國交通的罪魁禍首,并非是車太多?這幾座山不移除就白搭了

      搞垮中國交通的罪魁禍首,并非是車太多?這幾座山不移除就白搭了

      原來仙女不講理
      2026-05-07 23:09:21
      皇馬隊長親承內訌 被隊友推搡撞桌 當場昏迷+短暫失憶 將缺戰巴薩

      皇馬隊長親承內訌 被隊友推搡撞桌 當場昏迷+短暫失憶 將缺戰巴薩

      我愛英超
      2026-05-08 06:56:48
      涉疫郵輪船長宣布首例死亡視頻曝光 稱不會傳染

      涉疫郵輪船長宣布首例死亡視頻曝光 稱不會傳染

      看看新聞Knews
      2026-05-08 11:56:03
      2026-05-08 13:43:00
      智東西 incentive-icons
      智東西
      智東西,AI產業新媒體,專注報道人工智能的前沿技術發展,和技術應用帶來的千行百業產業變革。
      11770文章數 117062關注度
      往期回顧 全部

      科技要聞

      追趕星艦:中國商業火箭離SpaceX有多遠?

      頭條要聞

      "4只皮皮蝦1035元"店主事發次日病逝 家屬:不再開業

      頭條要聞

      "4只皮皮蝦1035元"店主事發次日病逝 家屬:不再開業

      體育要聞

      巴黎再進歐冠決賽,最尷尬的情況還是發生了

      娛樂要聞

      黃子佼獲緩刑4年,無需入獄服刑

      財經要聞

      一覺醒來,美伊又打起來了

      汽車要聞

      雷克薩斯全新純電三排SUV 全新TZ全球首發

      態度原創

      家居
      藝術
      教育
      游戲
      軍事航空

      家居要聞

      流動的尺度 打破家的形式主義

      藝術要聞

      探索施密德的油畫,感受無法抵擋的藝術魅力!

      教育要聞

      成長的勛章:藏在細節里的家教智慧——張敬家教好故事

      《Tokyo Stories》將由Happinet發行并將出展BitSummit

      軍事要聞

      伊朗:最高領袖穆杰塔巴全面掌控局勢

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产三级黄色片在线观看| 污视频在线看| 亚洲精品亚洲人成在线观看下载| 精品综合视频精品| 精品三级内地国产在线观看| 人妻精品动漫H无码中字| 亚洲精品无码在线观看| 久久午夜av一区二区| 亚洲色婷婷综合久久| 国品精品一区二区在线观看| 国产黄色小电影| 综合无码一区二区三区| 久久日韩在线观看视频| 人妻少妇heyzo无码专区| 日本精品人妻无码77777| 亚洲欧洲日本无在线码| 亚洲精品高清国产一久久| 99精品视频在线观看| 日韩区一区二区三区视频| 2019最新国产不卡a| 全免费a级毛片免费看| 亚洲影视中文字幕| 精品乱码久久久久久中文字幕| 国产精品自拍中文字幕| 天天爽夜夜爽夜夜爽精品视频| 国产激情一区二区三区四区| 超碰97人人天天蜜芽| 亚洲综合极品嫩模喷大量白浆| 国产拳交| 国产成人综合网在线观看| av无码一区二区三区| 女人与公狍交酡女免费| 国产av日韩av一区二区三区| 商南县| 丁香婷婷色综合激情五月| 日本精品中文字幕在线观看| 久99视频| 一区二区三区毛片无码| 国产香蕉视频在线播放| 国产农村妇女高潮大叫| 蜜桃av网站|