<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      ollama v0.20.0 更新:Gemma 4 全家桶發布,音頻、視覺、MoE、BPE 支持全面升級

      0
      分享至




      2026年4月3日,ollama 發布了v0.20.0版本。
      這次更新的核心非常明確:Gemma 4 正式加入支持,并且圍繞模型推理、音頻能力、Tokenizer、視覺測試、轉換器、OpenAI 音頻接口等多個方向進行了集中增強。

      如果你關注本次更新,可以直接從兩個關鍵詞理解:

      • ?Gemma 4

      • ?音頻與推理能力升級

      下面按照本次版本更新內容,逐項整理成一篇完整的技術更新說明。

      一、Gemma 4 正式加入支持

      本次 v0.20.0 最重要的變化,就是Gemma 4相關支持的加入。
      更新中給出了多個可直接運行的模型規格:

      1)Effective 2B(E2B)

      運行命令:

      ollama run gemma4:e2b

      這是 Gemma 4 的有效 2B 版本,適合輕量場景使用。

      2)Effective 4B(E4B)

      運行命令:

      ollama run gemma4:e4b

      這是 Gemma 4 的有效 4B 版本,在能力和資源消耗之間做了更平衡的選擇。

      3)26B(Mixture of Experts model with 4B active parameters)

      運行命令:

      ollama run gemma4:26b

      這是一個MoE(Mixture of Experts)模型,描述中說明其4B active parameters

      4)31B(Dense)

      運行命令:

      ollama run gemma4:31b

      這是 Gemma 4 的31B Dense版本,屬于更大規模的稠密模型。

      從這次發布的信息來看,Gemma 4 已經形成了較完整的規格覆蓋,從輕量到大模型都提供了支持方式,用戶可以按資源和場景選擇對應版本。

      二、What's Changed:本次更新涉及的關鍵內容

      本次版本的更新記錄非常集中,主要圍繞 Gemma 4、音頻、Tokenizer、文檔、推理與測試展開。下面逐條梳理。

      三、文檔更新

      首先是文檔相關更新:

      • ?docs: update pi docs

      這說明本次版本中對 pi 相關文檔進行了更新。
      雖然內容本身不多,但說明文檔層面同步跟進了新版本變化,方便用戶查閱和使用。

      四、Tokenizer 增強:支持 SentencePiece-style BPE

      本次更新中有一個非常關鍵的底層能力變化:

      • ?tokenizer: add SentencePiece-style BPE support

      這表示 Tokenizer 新增了SentencePiece 風格的 BPE 支持
      這一變化對于模型適配和分詞處理非常重要,尤其是在處理不同模型格式與分詞規則時,可以提升兼容性。

      與此同時,后續也有與 tokenizer 相關的配套修復:

      • ?mlx: respect tokenizer add_bos_token setting in pipeline

      這個改動說明在 pipeline 中會尊重 tokenizer 的add_bos_token設置。
      換句話說,Tokenizer 的行為會更貼合配置,避免在處理輸入時出現不一致情況。

      五、Gemma 4 的模型支持與轉換器更新 1)Gemma 4 GGML 模型支持

      更新中明確寫到:

      • ?gemma4: add Gemma 4 GGML model support

      這表示 Gemma 4 的 GGML 模型支持已經加入。

      2)轉換器更新:適配新的 weight drop 命名

      • ?gemma4: update converter for new weight drop naming

      這說明 Gemma 4 相關轉換器已經根據新的 weight drop 命名進行了更新。
      這是模型轉換流程中非常關鍵的一環,確保新版本模型文件命名和導入過程能夠順利對接。

      六、音頻能力大幅增強

      這次 v0.20.0 在音頻方向的變化非常密集,可以說是重點之一。

      1)添加音頻支持,使用 USM conformer encoder

      更新內容:

      • ?gemma4: add audio support with USM conformer encoder

      這表明 Gemma 4 新增了音頻支持,并且使用的是USM conformer encoder

      2)OpenAI 音頻 API 支持與能力檢測

      更新內容:

      • ?gemma4: add OpenAI audio API support and capability detection

      這說明本次版本已經加入了OpenAI 音頻 API 支持,并且還包含capability detection,也就是能力檢測機制。

      3)音頻輸入支持

      更新內容:

      • ?gemma4: add audio input support for run command

      這意味著在 run 命令中已經支持音頻輸入。

      4)新增轉寫命令

      更新內容:

      • ?gemma4: add transcribe command (ollama transcribe MODEL)

      這次新增了一個轉寫命令:

      ollama transcribe MODEL

      這對于音頻轉文字場景非常直接,命令形式也很清晰。

      5)增加 OpenAI 音頻轉寫 API 和 input_audio 支持

      更新內容:

      • ?gemma4: add OpenAI audio transcription API and input_audio support

      這進一步完善了音頻能力,不僅是輸入和轉寫,還補充了與 OpenAI 音頻轉寫 API 相關的支持,以及 input_audio 能力。

      6)音頻輸入改為 dropped file attachments

      更新內容:

      • ?cmd: simplify audio input to dropped file attachments

      這說明音頻輸入在命令層面被簡化為dropped file attachments,使用方式更直接。

      從這一組更新可以看出,v0.20.0 在音頻方向完成了從輸入、轉寫、API 到命令行體驗的一整套補強。

      七、Gemma 4 解析、渲染與集成測試支持

      本次更新還有一組圍繞 Gemma 4 的基礎設施改進:

      • ?gemma4: add parser, renderer, and integration test plumbing

      這說明已經加入了parser、renderer、integration test plumbing
      也就是說,Gemma 4 在解析、渲染以及集成測試方面的配套設施已經補上。

      1)渲染器修復:輸出 BOS token

      • ?gemma4: fix renderer to emit BOS token

      這是一個非常具體的修復,說明 renderer 現在會正確輸出BOS token

      2)渲染器重寫:與 HF Jinja2 模板完全一致

      • ?gemma4: rewrite renderer to match HF Jinja2 template exactly

      這說明渲染器被重寫,以確保與 HF Jinja2 模板保持完全一致。

      這個變化通常意味著模型輸入模板的行為會更加標準化,減少模板差異帶來的結果偏差。

      八、MoE 相關增強與修復

      Gemma 4 的 26B 版本是 MoE 模型,因此 MoE 相關改動非常關鍵。

      1)為 MoE router 增加 per_expert_scale,并修復 moe_intermediate 問題

      更新內容:

      • ?gemma4: add per_expert_scale to MoE router and fix moe_intermediate_s…

      雖然后半部分在記錄中被截斷,但已經明確看到兩個重點:

      • ? 為 MoE router 增加per_expert_scale

      • ? 修復moe_intermediate_s...相關問題

      2)修復 MoE fused gate_up split 和 multiline tool-call arg parsing

      更新內容:

      • ?gemma4: fix MoE fused gate_up split and multiline tool-call arg parsing

      這說明本次對 MoE 的 fused gate_up split 做了修復,同時還修復了multiline tool-call arg parsing

      3)MoE block 字段對齊格式調整

      更新內容:

      • ?Format Gemma4 MoE block field alignment

      這是一個格式層面的整理,說明 Gemma4 MoE block 的字段對齊做了統一和規范化。

      從這些信息可以看出,Gemma 4 的 MoE 版本在結構、解析、格式與計算路徑方面都做了較完整的修復和優化。

      九、視覺測試與 thinking 測試增強

      更新中還有測試相關增強:

      • ?integration: improve vision test robustness and add thinking tests

      這表示集成測試進一步增強了視覺測試的穩定性,同時新增了 thinking tests。
      從結果上看,這類更新主要是為了提升整體驗證能力,讓新版本在視覺相關場景和推理相關場景下更加可靠。

      十、Gemma 4 音頻測試與 OpenAI API 覆蓋

      音頻相關不僅有能力支持,也同步加入了測試覆蓋:

      • ?integration: add gemma4 audio tests including OpenAI API coverage

      這說明本次版本已經加入了 Gemma 4 音頻測試,并且包括 OpenAI API 的覆蓋。
      這和前面音頻能力的增強是相互呼應的,說明該版本并不是只做了功能接入,也同步補齊了對應驗證。

      十一、Gemma 4 視覺模型注釋與字段格式調整

      更新記錄中還有一些針對模型結構和代碼可讀性的整理:

      • ?Remove redundant comments in gemma4 vision model

      • ?Format Gemma4 MoE block field alignment

      前者表示移除了 Gemma 4 視覺模型中的冗余注釋。
      后者則對 Gemma4 MoE block 的字段對齊格式進行了調整。

      這類更新雖然看起來偏細節,但對于代碼維護、結構統一和后續協作非常重要。

      十二、內存緩存與推理緩存優化

      本次更新里還有一項和緩存相關的改動:

      • ?use 4096 kvcache.NewSWAMemCache

      • ?gemma4: use full SWA memory for better cache reuse

      這說明緩存機制做了調整:

      • ? 使用了4096 kvcache.NewSWAMemCache

      • ? 同時使用full SWA memory來獲得更好的 cache reuse

      這類優化通常和推理效率、上下文緩存復用體驗有關,是底層能力增強的一部分。

      十三、Gemma 4 clamps 初始化與后端加載修復

      更新記錄中還有:

      • ?gemma4: initialize clamps after backend load

      這表示 clamps 的初始化時機調整到了 backend load 之后。
      從描述來看,這是一個初始化順序上的修復,用于保證加載流程更穩定。

      十四、Gemma 4 GGML 改進合并

      更新記錄最后還有一個重要的合并信息:

      • ?Merge pull request from gemma4-ggml-improvements

      這說明本次版本把 Gemma 4 的 GGML 改進進行了合并,和前面提到的 GGML model support、converter 更新等內容形成閉環。

      十五、本次 v0.20.0 更新總結

      整體來看,ollama v0.20.0 這次更新可以概括為幾個核心方向:

      1. 1.Gemma 4 正式上線

      • ? 提供了 E2B、E4B、26B、31B 多種規格

      • ? 支持 GGML 模型

      2.音頻能力全面增強

      • ? 支持音頻輸入

      • ? 新增轉寫命令

      • ? 增加 OpenAI 音頻 API 與 transcription API 支持

      • ? 支持 input_audio

      • ? 簡化音頻輸入方式

      3.Tokenizer 和模板能力增強

      • ? 增加 SentencePiece-style BPE 支持

      • ? pipeline 尊重 add_bos_token

      • ? renderer 重寫并修復 BOS token 輸出

      4.MoE 與推理路徑優化

      • ? 增加 per_expert_scale

      • ? 修復 MoE 相關問題

      • ? 調整字段格式和分裂邏輯

      • ? 改進緩存復用

      5.測試與工程能力增強

      • ? 視覺測試穩定性提升

      • ? 新增 thinking tests

      • ? 補充 Gemma 4 音頻測試與 OpenAI API 覆蓋


      我們相信人工智能為普通人提供了一種“增強工具”,并致力于分享全方位的AI知識。在這里,您可以找到最新的AI科普文章、工具評測、提升效率的秘籍以及行業洞察。 歡迎關注“福大大架構師每日一題”,發消息可獲得面試資料,讓AI助力您的未來發展。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      張柏芝母親節曬仨兒子,8歲三胎兒子出鏡,謝霆鋒疑似陪同吃飯

      張柏芝母親節曬仨兒子,8歲三胎兒子出鏡,謝霆鋒疑似陪同吃飯

      老吳教育課堂
      2026-05-13 15:35:27
      嗜賭成性只是冰山一角,婚內出軌、睡有婦之夫,體壇丑聞毀三觀

      嗜賭成性只是冰山一角,婚內出軌、睡有婦之夫,體壇丑聞毀三觀

      阿訊說天下
      2026-04-25 11:15:04
      解放戰爭1946-1949年,我軍戰死的軍長以上級別將領是哪3位?

      解放戰爭1946-1949年,我軍戰死的軍長以上級別將領是哪3位?

      歷史龍元閣
      2026-05-12 14:25:12
      別犯政治幼稚病!美國國務卿被拉黑?法新社:盧比奧隨特朗普訪華

      別犯政治幼稚病!美國國務卿被拉黑?法新社:盧比奧隨特朗普訪華

      瑜說還休
      2026-05-13 11:32:46
      每體:拉什福德在巴塞羅那富人區租了一棟超700平米的住宅

      每體:拉什福德在巴塞羅那富人區租了一棟超700平米的住宅

      懂球帝
      2026-05-13 17:20:07
      女版楊瀚森?李月汝WNBA新季首次全場被棄用 飛翼吞首敗

      女版楊瀚森?李月汝WNBA新季首次全場被棄用 飛翼吞首敗

      醉臥浮生
      2026-05-13 10:06:14
      410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

      410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

      深度報
      2025-12-14 22:36:54
      西方專家感嘆:“中國是全世界,唯一強得悄無聲息的超級大國”!

      西方專家感嘆:“中國是全世界,唯一強得悄無聲息的超級大國”!

      何氽簡史
      2026-04-15 19:24:08
      唐湘龍痛批國民黨“跪美賣臺”;郭正亮:大陸已確定要駐軍臺灣!

      唐湘龍痛批國民黨“跪美賣臺”;郭正亮:大陸已確定要駐軍臺灣!

      放開他讓wo來
      2026-05-13 11:03:55
      孫銘陽正式宣布退出國家隊:我隨時都在,有召必回!

      孫銘陽正式宣布退出國家隊:我隨時都在,有召必回!

      現代快報
      2026-05-13 15:38:07
      兩次訪華,特朗普隨行美企高管有何不同?科技大佬占比近半,能源領域徹底淡出

      兩次訪華,特朗普隨行美企高管有何不同?科技大佬占比近半,能源領域徹底淡出

      時代周報
      2026-05-13 15:16:23
      9年無緣東決!有人要被清算了!

      9年無緣東決!有人要被清算了!

      柚子說球
      2026-05-13 07:04:09
      中國隊8強對手出爐!出線后至少5人獲健將稱號 無需高考+保送大學

      中國隊8強對手出爐!出線后至少5人獲健將稱號 無需高考+保送大學

      侃球熊弟
      2026-05-13 03:10:32
      比中國巨石還猛?這家6元低價+電子布紡織機龍頭   主力爆買3億元

      比中國巨石還猛?這家6元低價+電子布紡織機龍頭 主力爆買3億元

      元芳說投資
      2026-05-13 06:00:22
      湖人真該裁掉他!東契奇兩次對其不滿,八村塁因得罪他慘遭棄用?

      湖人真該裁掉他!東契奇兩次對其不滿,八村塁因得罪他慘遭棄用?

      你的籃球頻道
      2026-05-13 15:02:44
      4位伴娘婚禮前夜集體跑路,新娘指責其眼紅,伴娘稱待客太寒磣

      4位伴娘婚禮前夜集體跑路,新娘指責其眼紅,伴娘稱待客太寒磣

      觀世記
      2026-05-12 16:38:25
      好牛逼的狀元!29歲帶隊進西決,30歲帶隊進東決,31歲帶隊進東決

      好牛逼的狀元!29歲帶隊進西決,30歲帶隊進東決,31歲帶隊進東決

      球毛鬼胎
      2026-05-12 11:24:51
      白人女性與黑人女性的體味差異,網友真實分享引發熱議

      白人女性與黑人女性的體味差異,網友真實分享引發熱議

      特約前排觀眾
      2025-12-22 00:20:06
      排面拉滿!山姆兩家新店落地山東,本土商業能拿到啥好處

      排面拉滿!山姆兩家新店落地山東,本土商業能拿到啥好處

      閃電新聞
      2026-05-12 18:05:23
      什么事讓你知道好言難勸該死的鬼?全族都沒攔住,父子倆終身殘疾

      什么事讓你知道好言難勸該死的鬼?全族都沒攔住,父子倆終身殘疾

      夜深愛雜談
      2026-05-01 10:49:01
      2026-05-13 17:51:00
      moonfdd incentive-icons
      moonfdd
      福大大架構師每日一題
      1223文章數 68關注度
      往期回顧 全部

      科技要聞

      騰訊一季度營收1964.6億元 同比增9%

      頭條要聞

      4月汽車銷量發布 前十名僅剩一款燃油車

      頭條要聞

      4月汽車銷量發布 前十名僅剩一款燃油車

      體育要聞

      14年半,74萬,何冰嬌沒選那條更安穩的路

      娛樂要聞

      白鹿掉20萬粉,網友為李晨鳴不平

      財經要聞

      盤中最高4041.99點!創業板創歷史新高

      汽車要聞

      C級純電轎跑 吉利銀河"TT"申報圖來了

      態度原創

      本地
      數碼
      親子
      公開課
      軍事航空

      本地新聞

      用蘇繡的方式,打開江西婺源

      數碼要聞

      前行者帶來MUSE M80三模機械鍵盤:軟革后緣,999元

      親子要聞

      利拉魯肽使12歲以下肥胖兒童的BMI降低7.4%

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      沙特被指3月曾對伊朗發動多次“報復性”空襲

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产精品高清一区二区三区 | 无码人妻一区二区三区免费视频| 桃花色综合影院| 久久精品国产亚洲麻豆| 国产精品99久久久久久98AV| 亚洲精品影视| 久久亚洲v无码专区成人| 国产高清色高清在线观看| 亚洲免费人成影院| 少妇高潮一69aⅹ| 中国精品无码| 午夜A片| 国产女主播一区| 国产又黄又湿又刺激网站| 精品乱码一区内射人妻无码| 福利在线视频导航| 国产女人被狂躁到高潮小说| 久久99国产综合精品免费| 亚洲大尺度无码专区尤物| av偷拍亚洲一区二区三区| 中文字幕日韩激情无码不卡码| 欧洲亚洲国内老熟女超碰| 中文字幕人妻综合另类| 曰韩精品无码一区二区三区| 成人午夜激情在线观看| 国产女人精品| 久久AV无码精品人妻糸列| 亚洲乱码一区二三四区AVA| 亚洲a∨国产av综合av| 中国av一区二区三区| 国产人妻精品一区二区三区不卡 | 亚洲国产av一区二区| 工布江达县| 国产成熟妇女性视频电影| 亚洲乱码国产乱码精品精网站 | 国产精品无码AV私拍| 日韩不卡无码精品一区高清视频 | 在线视频一区二区三区色| 日本精品一区二区视频| 秋霞av一区二区三区| 奇米精品视频一区二区三区|