<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      用AI點外賣,少說倆字或許能省錢?

      0
      分享至

      想象一下,你正在經(jīng)營一家智能養(yǎng)蝦場(OpenClaw),通過AI系統(tǒng)管理數(shù)千畝龍蝦池塘。清晨,你對AI助手說:“幫我訂個披薩。”系統(tǒng)迅速響應(yīng),后臺計費系統(tǒng)記錄下這簡單的6個字。到了中午,你換了一種說法:“幫我預(yù)訂一份意大利薄底薩拉斯米腸披薩。”同樣的需求,更詳細的描述,但這一次,計費系統(tǒng)記錄的“詞元”數(shù)量其實大不相同。


      圖片來源:AI生成

      這不是科幻場景,而是每天都在發(fā)生的真實計費邏輯。在AI大模型時代,token是人工智能(尤其是大語言模型)處理中信息的最小單位,也是模型計費和處理的基本單位。2026年3月25日,全國科學(xué)技術(shù)名詞審定委員會正式發(fā)布《關(guān)于發(fā)布試用人工智能領(lǐng)域名詞token中文名“詞元”的公告》,將這個困擾業(yè)界多年的術(shù)語統(tǒng)一命名為“詞元”,標志著這一概念正式進入國家規(guī)范術(shù)語體系。

      詞元(Token)是大模型處理信息的最小信息單元,具有智能時代可計量、可定價、可交易的特征。

      從“字”到“詞元”:計費單位的革命

      傳統(tǒng)認知中,我們按字數(shù)計費——寫多少字付多少錢。但在AI世界里,這個邏輯被徹底顛覆。

      大模型廠商的計費公式可以簡化為:

      plain

      費用=(輸入詞元數(shù)×輸入單價+輸出詞元數(shù)×輸出單價)/1,000,000

      國家數(shù)據(jù)局最新數(shù)據(jù)顯示,截至2026年3月,我國日均詞元調(diào)用量已突破140萬億,相比2024年初的1000億增長超過1000倍。如此龐大的調(diào)用量背后,是一個精密的計費系統(tǒng)。以阿里云百煉平臺為例,Qwen3.6-Plus最低輸入價格2元/每百萬Tokens,最低輸出價格12元/每百萬Tokens。看似微小的差異,在大規(guī)模調(diào)用場景下,會被顯著放大,從而帶來明顯的成本差異。


      Qwen3.6-Plus推理服務(wù)價格

      圖片來源:阿里云官網(wǎng)

      BPE算法:打包常用字,拆分生僻詞

      要理解為什么“幫我訂個披薩”和“幫我預(yù)訂一份意大利薄底薩拉斯米腸披薩”會產(chǎn)生不同的詞元數(shù)量,需要深入字節(jié)對編碼(Byte Pair Encoding,BPE)算法的核心機制。(除了BPE算法外,常見的還有WordPiece、Unigram等算法,本文將以BPE算法為例。)

      BPE算法最早由Philip Gage于1994年提出,用于數(shù)據(jù)壓縮。2016年,瑞士蘇黎世大學(xué)的Rico Sennrich等人將其引入自然語言處理領(lǐng)域,發(fā)表了奠基性論文《Neural Machine Translation of Rare Words with Subword Units》,開創(chuàng)了子詞分詞的新紀元。

      BPE算法的運作原理可以概括為:不斷合并訓(xùn)練語料中出現(xiàn)頻率最高的符號對,直到達到預(yù)定詞匯表大小。

      讓我們用一個簡化示例說明,假設(shè)訓(xùn)練語料包含以下詞匯及出現(xiàn)頻率:

      “hug”:10次

      “pug”:5次

      “pun”:12次

      “bun”:4次

      “hugs”:5次

      第一步:將所有詞拆分為字符,添加結(jié)束符

      “hug” → “h u g ”

      “pug” → “p u g ”

      “pun” → “p u n ”

      “bun” → “b u n ”

      “hugs” → “h u g s ”

      初始詞匯表僅包含基礎(chǔ)字符:{b, g, h, n, p, s, u, }

      第二步:統(tǒng)計相鄰字符對的出現(xiàn)頻率

      “u g”:15次(來自“hug”的10次 + “hugs”的5次)

      “u n”:16次(來自“pun”的12次 + “bun”的4次)

      “p u”:17次(來自“pug”的5次 + “pun”的12次)

      第三步:合并最高頻字符對

      假設(shè)“p u”頻率最高(17次),創(chuàng)建新符號“pu”,

      詞匯表擴展為:{b, g, h, n, p, s, u, , pu}

      第四步:迭代重復(fù)

      繼續(xù)統(tǒng)計新語料中的字符對頻率,合并下一個最高頻對,直到達到預(yù)設(shè)的詞匯表大小(如GPT-2為50,257個token)。

      多個常用字被打包成單個詞元

      像“的”“是”“了”“在”等超高頻漢字,在訓(xùn)練語料中反復(fù)出現(xiàn),BPE算法會將它們與相鄰高頻字組合成固定詞元。例如:

      “的” → 單獨1個token

      “中國” → 1個token(高頻組合)

      “人工智能” → 2個token(“人工”+“智能”)

      單個生僻字和長詞被拆解成多個詞元

      對于低頻字或?qū)I(yè)術(shù)語,BPE算法缺乏足夠的合并動力,只能拆分為基礎(chǔ)字符甚至UTF-8字節(jié):

      “薹”(生僻字)→ 可能被拆為2-3個token

      “意大利薄底薩拉斯米腸披薩” → 可能被拆為10+個token

      這種差異直接體現(xiàn)在計費上。實測數(shù)據(jù)顯示,同樣長度的內(nèi)容,中文消耗的token數(shù)約為英文的2-2.7倍。以GPT-4o計費標準計算,處理100萬字符的中文文本比英文貴約50%。

      高計費差異背后的經(jīng)濟邏輯

      理解BPE算法后,我們就能解釋開頭養(yǎng)蝦場的計費差異:


      圖片來源:作者制作

      這種計費機制有其合理性:低頻詞需要模型進行更多計算來理解和生成,消耗更多算力資源。但從用戶角度看,這意味著表達越精確,成本越高。

      那如何降低詞元成本呢?對于普通用戶和開發(fā)者,理解BPE算法可以顯著降低使用成本:

      1. 精簡表達

      避免冗余修飾詞。“訂披薩”比“預(yù)定一份意大利薄底薩拉斯米腸披薩”可顯著減少詞元消耗。

      2.使用高頻詞匯

      BPE算法偏愛高頻組合。用“電腦”而非“電子計算機”,用“手機”而非“移動電話”。

      3.善用緩存

      阿里云百煉等平臺支持上下文緩存,命中緩存的輸入token價格通常只有普通輸入的1/10。對于重復(fù)性查詢,保持上下文連貫可大幅降低成本。

      4.選擇中文優(yōu)化模型

      通義千問、DeepSeek等國產(chǎn)模型針對中文優(yōu)化,同等內(nèi)容下token消耗比國際模型少30%-50%

      5.監(jiān)控token使用

      使用tiktoken等工具預(yù)先計算token數(shù)量,避免超出預(yù)算。OpenAI的tiktoken庫基于Rust實現(xiàn),可精確統(tǒng)計各模型的token消耗。

      詞元的定名不僅是一個術(shù)語的統(tǒng)一,更標志著AI產(chǎn)業(yè)進入精細化運營階段。當“幫我訂個披薩”和“幫我預(yù)定一份意大利薄底薩拉斯米腸披薩”產(chǎn)生不同的賬單時,我們實際上見證了一種新的語言經(jīng)濟學(xué)誕生——表達的精確度與計算成本直接掛鉤。

      BPE算法通過頻率統(tǒng)計實現(xiàn)的“打包”與“拆分”機制,本質(zhì)上是用統(tǒng)計學(xué)方法模擬人類語言的層級結(jié)構(gòu)。常用字“廉價”,生僻詞更“高價”,這種看似不均衡的分配,實則是大數(shù)據(jù)時代效率與成本的平衡之道。


      圖片來源:AI生成

      正如全國科技名詞委公告所言,“詞元”一詞“符合單義性、科學(xué)性、簡明性、協(xié)調(diào)性等科技名詞審定原則”。當我們下次與AI對話時,或許可以多想一想:這句話,值多少個詞元?

      參考文獻:

      1.Sennrich, R., Haddow, B., & Birch, A. (2016). Neural Machine Translation of Rare Words with Subword Units. arXiv:1508.07909.

      2.Radford, A., et al. (2019). Language Models are Unsupervised Multitask Learners. OpenAI.

      3.http://www.cnterm.cn/news/mtsm/202603/t20260327_828265.html

      4.http://www.cnterm.cn/news/mtsm/202603/t20260327_828253.html

      5.http://finance.people.com.cn/n1/2026/0330/c1004-40691865.html

      6.https://tech.cnr.cn/gstj/20260327/t20260327_527564025.shtml

      7.http://www.cnterm.cn/news/tzgg/202603/t20260325_827999.html

      來源:蝌蚪五線譜

      編輯:小鹿

      轉(zhuǎn)載內(nèi)容僅代表作者觀點

      不代表中科院物理所立場

      如需轉(zhuǎn)載請聯(lián)系原公眾號

      聲明:包含AI生成內(nèi)容

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      香港2500萬美元(約1.7億元人民幣)拿下世界杯轉(zhuǎn)播權(quán),此前FIFA給央視開出3億美元天價,是印度的17倍

      香港2500萬美元(約1.7億元人民幣)拿下世界杯轉(zhuǎn)播權(quán),此前FIFA給央視開出3億美元天價,是印度的17倍

      浙江之聲
      2026-05-08 11:42:15
      日本航空拿下宇樹科技,轟動全球!

      日本航空拿下宇樹科技,轟動全球!

      新零售參考Pro
      2026-05-07 17:31:09
      英超有望連續(xù)兩季六隊踢歐冠,但前提是多項條件同時滿足

      英超有望連續(xù)兩季六隊踢歐冠,但前提是多項條件同時滿足

      樂道足球C
      2026-05-08 19:14:28
      水泥的“壽命”只有50年,如果過期了,房子會發(fā)生什么變化?

      水泥的“壽命”只有50年,如果過期了,房子會發(fā)生什么變化?

      收藏大視界
      2026-05-05 18:57:13
      快訊!關(guān)于日本的消息!

      快訊!關(guān)于日本的消息!

      故事終將光明磊落
      2026-05-08 13:43:11
      解放軍里職務(wù)最低的開國將軍:一直到本人去世,最高職務(wù)僅為師長

      解放軍里職務(wù)最低的開國將軍:一直到本人去世,最高職務(wù)僅為師長

      搜史君
      2026-05-08 18:40:07
      苦等十年!上海這條地鐵線終于動了

      苦等十年!上海這條地鐵線終于動了

      新浪財經(jīng)
      2026-05-07 19:26:47
      中方應(yīng)將稀土繼續(xù)當白菜賣?德外長:歐洲不掌握稀土這類戰(zhàn)略資源

      中方應(yīng)將稀土繼續(xù)當白菜賣?德外長:歐洲不掌握稀土這類戰(zhàn)略資源

      丁丁鯉史紀
      2026-05-08 18:22:17
      16歲女生玩秋千墜亡后續(xù):多視角曝光,死因非沒綁緊,細節(jié)披露

      16歲女生玩秋千墜亡后續(xù):多視角曝光,死因非沒綁緊,細節(jié)披露

      李晚書
      2026-05-06 13:21:59
      亞足聯(lián)回顧亞洲杯數(shù)據(jù):伊朗隊常規(guī)時間總勝場第一,國足負場最多

      亞足聯(lián)回顧亞洲杯數(shù)據(jù):伊朗隊常規(guī)時間總勝場第一,國足負場最多

      懂球帝
      2026-05-08 18:41:15
      內(nèi)訌后加速換帥!皇馬高層終于醒悟,穆里尼奧將回歸,姆巴佩笑了

      內(nèi)訌后加速換帥!皇馬高層終于醒悟,穆里尼奧將回歸,姆巴佩笑了

      祥談體育
      2026-05-08 16:51:26
      不想訪華了?美國聯(lián)合27國,準備廢除中國王牌,中國自爆家底

      不想訪華了?美國聯(lián)合27國,準備廢除中國王牌,中國自爆家底

      人間無味啊
      2026-05-07 10:31:04
      明星套現(xiàn)離場,留下85億窟窿,華誼兄弟被誰“抽”干了?

      明星套現(xiàn)離場,留下85億窟窿,華誼兄弟被誰“抽”干了?

      帥真商業(yè)
      2026-05-06 21:23:01
      納瓦爾:不要去管別人,只管早睡、運動和讀書

      納瓦爾:不要去管別人,只管早睡、運動和讀書

      書窗小記
      2026-05-06 21:38:32
      黃仁勛很生氣:中國芯片用“落后”7nm工藝,搶走了英偉達50%市場

      黃仁勛很生氣:中國芯片用“落后”7nm工藝,搶走了英偉達50%市場

      科技專家
      2026-05-07 11:39:11
      特朗普表態(tài)伊方“新提議”不可接受,已下令美軍參與恢復(fù)霍爾木茲通航行動 伊朗:干涉海峽“新管理”將被視為違反停火

      特朗普表態(tài)伊方“新提議”不可接受,已下令美軍參與恢復(fù)霍爾木茲通航行動 伊朗:干涉海峽“新管理”將被視為違反停火

      每日經(jīng)濟新聞
      2026-05-04 16:18:27
      美國《時代》周刊公布2026年全球100大影響力企業(yè),中國多企入榜

      美國《時代》周刊公布2026年全球100大影響力企業(yè),中國多企入榜

      聞號說經(jīng)濟
      2026-05-08 17:06:37
      賴因德斯可能已要離開曼城?重返意甲可能性浮現(xiàn)

      賴因德斯可能已要離開曼城?重返意甲可能性浮現(xiàn)

      綠茵情報局
      2026-05-08 18:19:59
      康熙長子被圈禁26年,瘋狂納妃生下20個孩子,卻因禍得福成贏家

      康熙長子被圈禁26年,瘋狂納妃生下20個孩子,卻因禍得福成贏家

      浩渺青史
      2026-05-06 00:41:01
      浮嶋敏:不會因為是踢日本就有更高動力,但我對他們了解更多

      浮嶋敏:不會因為是踢日本就有更高動力,但我對他們了解更多

      懂球帝
      2026-05-08 12:25:02
      2026-05-08 19:56:51
      中科院物理所 incentive-icons
      中科院物理所
      愛上物理,改變世界。
      10146文章數(shù) 136532關(guān)注度
      往期回顧 全部

      科技要聞

      SK海力士平均獎金600萬 工服成相親神器

      頭條要聞

      媒體:"4只皮皮蝦1035元"店主去世僅43歲 觸發(fā)人們反思

      頭條要聞

      媒體:"4只皮皮蝦1035元"店主去世僅43歲 觸發(fā)人們反思

      體育要聞

      他把首勝讓給隊友,然后用一年時間還清賬單

      娛樂要聞

      古天樂被曝隱婚生子,新娘竟是她

      財經(jīng)要聞

      輪到豆包收割了?

      汽車要聞

      MG 4X實車亮相 將于5月11日開啟盲訂

      態(tài)度原創(chuàng)

      家居
      游戲
      健康
      數(shù)碼
      本地

      家居要聞

      流動的尺度 打破家的形式主義

      索尼PS要打造最佳游戲平臺!獨占新作用AI 玩家別慌

      干細胞能讓人“返老還童”嗎

      數(shù)碼要聞

      三星家電退出大陸市場 部分門店已撤場 經(jīng)銷商集體竟流入咸魚甩尾貨

      本地新聞

      用蘇繡的方式,打開江西婺源

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 国产精品白浆在线观看免费 | 中文无码日| 男女猛烈xx00免费视频试看| 狠狠综合久久综合88亚洲日本| 香蕉久久夜色精品国产尤物| 线观看的国产成人av天堂| 麻豆熟妇乱妇熟色A片在线看| 国内精品久久久久影院优| 男女性生活交配一进一出成人久久影院| 免费 无码 国产精品| 国产激情婷婷丁香五月天| 少妇无码av无码专区线| www婷婷com| 亚洲免费人妻| 亚洲自偷自偷在线成人网站传媒| 亚洲成av人片高潮喷水| 丁香五月激情图片| 国产精品午夜福利免费看| 免费观看一级毛一片| 欧美日韩在线视频| 人妻无码免费系列| 麻豆视屏| 久久精品少妇高潮a片免费观| 成 人 色 网 站免费观看| 极品少妇xxxx精品少妇偷拍| 久久人人97超碰精品| 永久免费AV无码网站大全| 亚瑟国产精品久久| 日本在线视频www鲁啊鲁| 久草热在线视频免费播放| 啊啊舔穴午夜免费视频| 国产精品伦人视频免费看| 国产99re热这里只有精品| 国产成人精品日本亚洲网址| 午夜成人福利| 亚洲AV秘 无码一区二区久| 国产久热精品无码激情| 久久精品女| 国产美女被遭强高潮免费网站| 国产一卡2卡3卡四卡精品网站免费国 | 亚洲av无码潮喷在线观看|