<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      ollama v0.20.7 最新版更新詳解:ROCm 7.2.1、Gemma4 渲染修復與多項 Metal/Renderer 回歸修補

      0
      分享至




      2026年4月13日,ollama 發布了 v0.20.7 版本。
      這次更新雖然版本號看起來是一次常規小版本升級,但從變更內容來看,實際上是一次面向 GPU 生態、模型渲染邏輯和 Metal 后端兼容性的集中修復版本。尤其是 Gemma4 相關修復、ROCm 版本升級,以及多個 ggml Metal 相關補丁的回補,說明這一版重點并不只是“更新依賴”,而是圍繞真實運行中的質量問題進行了一輪修正。

      一、v0.20.7 發布概覽

      本次發布版本為v0.20.7,發布時間是2026年4月13日
      從變更列表看,本次更新包含:

      • ?修復 gemma:e2b 和 gemma:e4b 在關閉 thinking 時的質量問題

      • ?Linux 下 ROCm 更新到 7.2.1

      • ? 多個與Gemma4相關的渲染器修復、回歸修正和測試調整

      • ? 多個Metal 后端補丁同步更新

      • ? 相關的測試與構建配置同步升級

      整體來看,這一版不是功能大擴展,而是以“修復、回補、兼容性調整”為主。對于依賴 GPU 推理、尤其是 AMD ROCm、Apple Metal 以及 Gemma4 模型相關能力的用戶來說,這個版本具有比較明確的升級價值。

      二、本次更新的核心內容 1)修復 gemma:e2b 和 gemma:e4b 在關閉 thinking 時的質量問題

      這是本次更新中最核心、最直接面向模型效果的修復之一。
      官方說明寫得很明確:Fix quality of gemma:e2b and gemma:e4b when thinking is disabled

      這意味著當 Gemma4 系列模型中的 e2b、e4b 在thinking 被禁用的情況下,輸出質量存在問題,而 v0.20.7 對這個問題進行了修復。

      結合提交記錄可以看到,這部分修復過程并不簡單,期間圍繞 Gemma4 的 renderer 做了多輪修改:

      • ? 修復 nothink case renderer

      • ? 添加 nothink renderer 測試

      • ? 隨后又回滾了測試和部分 renderer 修復

      • ? 最終恢復 e2b-style nothink prompt

      從這些提交名稱可以看出,問題的焦點主要集中在“不啟用 thinking 時,Gemma4 的提示詞渲染方式”
      也就是說,模型質量問題并不一定來自模型本身參數,而是和 renderer 在構造提示時的行為有關。最終版本選擇恢復一種更合適的 nothink prompt 方式,以改善 e2b、e4b 的輸出表現。

      2)Linux 下 ROCm 更新到 7.2.1

      另一個非常重要的更新是:ROCm: Update to ROCm 7.2.1 on Linux
      這說明 ollama 在 Linux 平臺上的 ROCm 支持版本進行了升級,從7.2更新到7.2.1

      這類更新通常意味著:

      • ? 使用更新的 ROCm 容器鏡像

      • ? 構建、測試和運行環境同步對齊

      • ? 提升對 AMD GPU 相關運行環境的兼容性

      從變更內容看,相關修改不僅出現在測試工作流里,也出現在 Dockerfile 里:

      • ?.github/workflows/test.yaml中 ROCm 容器從rocm/dev-ubuntu-22.04:7.2改為rocm/dev-ubuntu-22.04:7.2.1

      • ?DockerfileROCMVERSION=7.2更新為ROCMVERSION=7.2.1

      這說明這次升級不是單點調整,而是構建鏈路、CI 測試鏈路、容器環境的同步升級。
      對于依賴 ROCm 的 Linux 用戶來說,這是一項非常關鍵的版本對齊,屬于“平臺支持跟進式升級”。

      三、構建與測試相關變更 1)測試工作流中的 ROCm 容器升級

      .github/workflows/test.yaml中,ROCm 測試環境從:

      • ?rocm/dev-ubuntu-22.04:7.2

      變更為:

      • ?rocm/dev-ubuntu-22.04:7.2.1

      除此之外,ROCm 測試仍保持原有配置:

      • ?extra-packages: rocm-libs

      • ?flags: '-DAMDGPU_TARGETS=gfx1010 -DCMAKE_PREFIX_PATH=/opt/rocm'

      這說明測試流程的目標并未改變,仍然圍繞特定 AMD GPU 架構和 ROCm 構建路徑進行,但底層容器版本更新到了 7.2.1。

      2)Dockerfile 中 ROCMVERSION 同步更新

      Dockerfile中,版本變量也從:

      • ?ARG ROCMVERSION=7.2

      更新為了:

      • ?ARG ROCMVERSION=7.2.1

      這說明項目構建時使用的 ROCm 版本已經同步到新版本。
      這種同步很重要,因為如果測試環境和構建環境不一致,就可能引入難以排查的問題。現在二者同時升級,說明本次版本發布在環境一致性上做了處理。

      四、Gemma4 渲染器與模板的多輪修復

      這一部分是本次更新里非常值得關注的內容,因為它直接關系到模型提示詞渲染和最終輸出質量。

      1)Gemma4 renderer 的結構調整

      文件model/renderers/gemma4.go有較大改動,變更量為129 changes: 85 additions & 44 deletions
      這說明 Gemma4 渲染器并非小修,而是進行了比較系統的調整。

      從可見的核心變化看,生成 prompt 的邏輯發生了變化:

      原本在滿足條件時會在生成提示里寫入:

      • ?<|turn>model\n

      • ? 如果沒有 thinking,則再寫入<|channel|>thought\n

      而更新后,這一段邏輯被調整,說明在生成階段對“是否啟用 thinking”的處理方式進行了重新安排。

      結合提交記錄中的變化內容,整個過程經歷了:

      • ? 修復 nothink case renderer

      • ? 添加 nothink renderer tests

      • ? 回滾測試

      • ? 回滾修復

      • ? 最終恢復 e2b-style nothink prompt

      這說明團隊在修復過程中對渲染方式做了驗證和回退,最終采用了穩定方案。

      2)Gemma4 的 testdata 模板重命名

      本次更新里有一個值得注意的文件變更:

      • ?model/renderers/testdata/gemma4_chat_template.jinja2
        被重命名為

      • ?model/renderers/testdata/gemma4_31b_chat_template.jinja2

      并且標注為File renamed without changes
      也就是說,文件內容沒有變化,只是文件名調整了。

      這通常意味著測試數據的命名與模型規格、模板版本或者用途進行了區分,使命名更加明確。
      從結果上看,這有助于區分不同 Gemma4 模板場景,避免混淆。

      3)新增 gemma4_e2b_chat_template.jinja2

      另一個新增文件是:

      • ?model/renderers/testdata/gemma4_e2b_chat_template.jinja2

      從文件名可以直接看出,它是針對gemma4 e2b場景的測試模板。
      這與前面“修復 e2b 和 e4b 在 thinking disabled 時的質量問題”是對應的。

      也就是說,這次更新并不是單純改一行代碼,而是配套增加了針對性模板測試,以便驗證 e2b 場景下的渲染邏輯是否正確。

      五、ggml 相關補丁同步更新

      本次版本中還包含多個llama/patches下的補丁變更,這些補丁主要涉及 ggml 的不同后端實現,包括 CPU、CUDA、Metal、Vulkan 等。雖然很多 patch 的變更在展示中只露出部分內容,但從整體文件列表可以看到,本次升級對底層推理棧做了同步適配。

      1)0027-interleave-multi-rope.patch

      這個補丁的主題是:

      • ?interleave multi rope

      其說明寫的是:
      由于 ollama 不再把 mrope 用于其他用途,因此將其改為表示qwen3vl 使用的 interleaved 版本

      對應修改涉及四個文件:

      • ?ggml/src/ggml-cpu/ops.cpp

      • ?ggml/src/ggml-cuda/rope.cu

      • ?ggml/src/ggml-metal/ggml-metal.metal

      • ?ggml/src/ggml-vulkan/vulkan-shaders/rope_funcs.glsl

      這個補丁中 Metal 文件的修改量從 8 行變為 10 行左右,說明在 Metal 實現上也有相應適配。

      從版本升級角度看,這屬于 rope 相關計算邏輯的內部調整,雖然不是用戶界面層面的變化,但會影響到底層位置編碼處理方式。

      2)0032-ggml-enable-MLA-flash-attention-for-GLM-4.7-flash.patch

      這個補丁的主題是:

      • ?ggml-enable-MLA-flash-attention-for-GLM-4.7-flash

      從名稱可以看出,它是為GLM-4.7-flash啟用MLA flash attention相關能力的補丁。
      在變更展示中,主要體現為ggml/src/ggml-metal/ggml-metal.metal文件有調整,新增了 1 行、刪除了 1 行。

      雖然展示內容很有限,但從補丁名和文件路徑可以確定:
      這是一次針對 ggml Metal 后端 flash attention 行為的適配,目的是支持某些模型在 Metal 平臺上正確啟用相關能力。

      3)0033-ggml-metal-solve_tri.patch

      這個補丁名稱是:

      • ?ggml-metal-solve_tri

      對應的變更涉及ggml/src/ggml-metal/ggml-metal.metal,修改點在一個較長的代碼塊中。
      從補丁標題看,重點在于解決三角相關計算或三角求解路徑的問題。

      雖然展示里沒有展開全部上下文,但可以確認這是一項 Metal 后端內部修復補丁,目的是讓相關數學計算在 Metal 環境下更穩定或更正確。

      4)0034-ggml-metal-guard-mul_mat_id-map0-and-add-ne20-22-spe.patch

      這個補丁名稱較長,核心意思是:

      • ? 為mul_mat_idmap0做保護

      • ? 并增加ne20-22相關的特殊處理

      對應修改同樣落在ggml/src/ggml-metal/ggml-metal.metal中,增加了 1 行,刪除了 1 行。

      從補丁風格可以看出,這屬于針對 Metal 矩陣乘法映射路徑的保護性修復,避免某些邊界條件下出錯,同時加入特定尺寸條件的支持。

      5)0036-backport-kernels-for-gemma4.patch

      這個補丁名稱說明它是:

      • ? 為 Gemma4 回補相關 kernels

      對應的變更也落在ggml/src/ggml-metal/ggml-metal.metal
      從提交順序看,這個 patch 與 Gemma4 的 renderer 修復、notthink 邏輯回調一起,構成了本次 Gemma4 支持鏈路的一部分。

      換句話說,Gemma4 的修復不僅僅在上層 renderer,還在底層 kernel 方面有對應回補。

      六、Metal 后端相關的嵌入式文件同步變更

      除了llama/patches目錄下的補丁,本次更新還涉及兩個 Metal 嵌入式文件:

      • ?ml/backend/ggml/ggml/src/ggml-metal/ggml-metal-embed.metal

      • ?ml/backend/ggml/ggml/src/ggml-metal/ggml-metal.metal

      這兩個文件都涉及kernel_rope_multi相關邏輯,并且都出現了相同的關鍵調整:

      • ?float theta_base;

      • ? 變為float theta_base = 0.0;

      • ? 條件判斷由
        sector < 3 * args.sect_1
        調整為
        sector < 1 + 3 * args.sect_1

      這說明在 Metal 的 rope multi 處理邏輯中,對 theta_base 做了初始化,并修正了區間判斷條件。

      這種改動看起來很小,但對于 GPU kernel 來說,初始化和邊界條件往往非常關鍵,直接影響結果正確性和穩定性。

      七、其他 Metal 文件的同步變化

      本次版本中,ggml/src/ggml-metal/ggml-metal.metal多處被更新,這些更新分散在不同的 patch 中,說明 Metal 后端是本次版本的重點之一。

      從變更摘要可見,Metal 文件涉及的場景包括:

      • ? rope multi

      • ? flash attention

      • ? solve_tri

      • ? mul_mat_id map0

      • ? Gemma4 kernels 回補

      這說明 v0.20.7 不只是簡單提升某個模型的表現,而是對 Metal 推理鏈路做了系統性的修復和補齊。
      對于使用 Apple 平臺推理的用戶來說,這種更新通常意味著更好的兼容性,也意味著舊版本中可能存在的邊界問題被逐步清理。

      八、本次版本的提交節奏與修復過程

      從公開提交記錄來看,這次版本并不是“一次改完”,而是經過了多次嘗試與回滾:

      • ? 先修復 nothink case renderer

      • ? 再添加 nothink renderer tests

      • ? 接著回滾測試

      • ? 再回滾修復

      • ? 最后恢復 e2b-style nothink prompt

      這種節奏反映出一個很典型的現實:
      看似只是一個提示詞渲染問題,實際上會牽連到模型輸出質量、渲染模板、測試樣例、后端兼容性等多個層面。最終能夠在發布版中穩定下來,說明這次修復經過了反復驗證。

      九、v0.20.7 適合誰升級

      基于本次變更內容,v0.20.7 對以下場景尤其值得關注:

      • ? 使用gemma:e2b / gemma:e4b的用戶

      • ? 依賴thinking disabled模式的用戶

      • ? 在Linux + ROCm環境下運行的用戶

      • ? 依賴Metal后端推理的用戶

      • ? 使用 Gemma4 相關渲染模板或測試鏈路的用戶

      因為這次更新直接涉及這些場景的修復與對齊,屬于針對性較強的一版。

      十、總結

      代碼地址:github.com/ollama/ollama

      ollama v0.20.7 雖然是一個小版本號更新,但內容并不輕量。
      從官方變更和提交記錄看,這次升級主要圍繞以下幾個重點展開:

      1. 1.修復 gemma:e2b 和 gemma:e4b 在關閉 thinking 時的質量問題

      2. 2.Linux 下 ROCm 升級到 7.2.1

      3. 3.Gemma4 renderer 進行多輪修復與回滾,最終恢復 e2b-style nothink prompt

      4. 4.Gemma4 測試模板新增與重命名

      5. 5.ggml 的多個 patch 同步更新,覆蓋 CPU / CUDA / Metal / Vulkan

      6. 6.Metal 后端的 rope、flash attention、求解、矩陣映射、Gemma4 kernel 等多項修補

      7. 7.測試和 Docker 構建鏈路同步升級,確保環境一致


      我們相信人工智能為普通人提供了一種“增強工具”,并致力于分享全方位的AI知識。在這里,您可以找到最新的AI科普文章、工具評測、提升效率的秘籍以及行業洞察。 歡迎關注“福大大架構師每日一題”,發消息可獲得面試資料,讓AI助力您的未來發展。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      女司機致2死6傷后續!知情人爆料:女子系專家級醫生,持駕照多年

      女司機致2死6傷后續!知情人爆料:女子系專家級醫生,持駕照多年

      千言娛樂記
      2026-05-12 15:13:39
      蔣友青:我不認識蔣萬安,平時完全沒來往!他們之間發生了什么?

      蔣友青:我不認識蔣萬安,平時完全沒來往!他們之間發生了什么?

      凡人侃史
      2026-05-12 14:37:12
      黑衣女子推搡哨兵后續:知情人爆料,官媒發聲恐不止坐牢這么簡單

      黑衣女子推搡哨兵后續:知情人爆料,官媒發聲恐不止坐牢這么簡單

      趙枹是個熱血青年
      2026-05-12 23:05:47
      顧客萬元蘋果手機遺落衛生間 被海底撈保潔藏匿郵寄 當事人報警希望追責 警方不予立案 律師:侵占罪是自訴案件 警方無權立案偵查

      顧客萬元蘋果手機遺落衛生間 被海底撈保潔藏匿郵寄 當事人報警希望追責 警方不予立案 律師:侵占罪是自訴案件 警方無權立案偵查

      閃電新聞
      2026-05-12 19:52:27
      我國都有哪些常見毒蛇?哪種蛇最毒?盤點我國十大毒蛇,第一名致死率超65%

      我國都有哪些常見毒蛇?哪種蛇最毒?盤點我國十大毒蛇,第一名致死率超65%

      農夫也瘋狂
      2026-05-13 11:40:43
      火箭中鋒申京和女友社媒相互取關,疑似分手

      火箭中鋒申京和女友社媒相互取關,疑似分手

      懂球帝
      2026-05-13 10:45:10
      6月1日醫保新規全國落地,城鄉報銷全面統一,普通人看病有福了

      6月1日醫保新規全國落地,城鄉報銷全面統一,普通人看病有福了

      復轉這些年
      2026-05-12 23:44:15
      孫銘徽時隔93天復出:3中0獻0+3+2+2 無得分仍是晉級功臣

      孫銘徽時隔93天復出:3中0獻0+3+2+2 無得分仍是晉級功臣

      醉臥浮生
      2026-05-13 21:36:55
      朱珠與老公上海南京西路街邊喝咖啡被偶遇,美的像拍偶像劇!

      朱珠與老公上海南京西路街邊喝咖啡被偶遇,美的像拍偶像劇!

      阿廢冷眼觀察所
      2026-05-13 10:45:54
      手機號要變了:中國移動開了個頭

      手機號要變了:中國移動開了個頭

      林子說事
      2026-05-12 18:37:55
      為啥現在沒人買枇杷了?不是大家不愛吃,是這4個現實原因勸退

      為啥現在沒人買枇杷了?不是大家不愛吃,是這4個現實原因勸退

      椰青美食分享
      2026-05-13 00:55:06
      不堪入目!女子出軌,老公解鎖手機,滿屏露骨記錄,女子跪地求饒

      不堪入目!女子出軌,老公解鎖手機,滿屏露骨記錄,女子跪地求饒

      川渝視覺
      2026-05-12 22:28:55
      100元和20元香煙有啥區別?煙廠老員工說實話,多數煙民都想錯了

      100元和20元香煙有啥區別?煙廠老員工說實話,多數煙民都想錯了

      復轉這些年
      2026-05-13 11:29:28
      國際足聯認慫了

      國際足聯認慫了

      不惑豬的頻道
      2026-05-12 21:40:48
      炸了!巴拉圭總統在臺灣當場 “翻臉”!

      炸了!巴拉圭總統在臺灣當場 “翻臉”!

      有態度的何總
      2026-05-13 08:20:57
      “1035元4只皮皮蝦”事件最新進展:涉事出租車司機徐某已被開除;當事顧客稱被網暴

      “1035元4只皮皮蝦”事件最新進展:涉事出租車司機徐某已被開除;當事顧客稱被網暴

      極目新聞
      2026-05-13 13:15:20
      新疆一女生沒電腦在電競館學習,女店主得知后免費:只要是不打游戲,來學習的都免費

      新疆一女生沒電腦在電競館學習,女店主得知后免費:只要是不打游戲,來學習的都免費

      瀟湘晨報
      2026-05-13 15:32:29
      FIFA秘書長已抵京+溫格陪同!已與足協主席見面 全力勸說央視簽字

      FIFA秘書長已抵京+溫格陪同!已與足協主席見面 全力勸說央視簽字

      風過鄉
      2026-05-13 13:00:53
      一聲嘆息!場均1.2分,姚明最后一個NBA隊友,今夏可能也要退役了

      一聲嘆息!場均1.2分,姚明最后一個NBA隊友,今夏可能也要退役了

      球毛鬼胎
      2026-05-13 17:41:37
      穆帥若回皇馬要買誰?四人引援名單曝光,老佛爺看完得破產!

      穆帥若回皇馬要買誰?四人引援名單曝光,老佛爺看完得破產!

      仰臥撐FTUer
      2026-05-13 13:13:03
      2026-05-13 21:48:49
      moonfdd incentive-icons
      moonfdd
      福大大架構師每日一題
      1223文章數 68關注度
      往期回顧 全部

      科技要聞

      騰訊一季度營收1964.6億元 同比增9%

      頭條要聞

      媒體:黃仁勛絕非"順路同行" 而是美方刻意納入的籌碼

      頭條要聞

      媒體:黃仁勛絕非"順路同行" 而是美方刻意納入的籌碼

      體育要聞

      14年半,74萬,何冰嬌沒選那條更安穩的路

      娛樂要聞

      白鹿掉20萬粉,網友為李晨鳴不平

      財經要聞

      美國總統特朗普抵達北京

      汽車要聞

      C級純電轎跑 吉利銀河"TT"申報圖來了

      態度原創

      旅游
      本地
      房產
      藝術
      公開課

      旅游要聞

      中國新文創市集集結各地文創,五大演藝專區百場演出好戲不斷

      本地新聞

      用蘇繡的方式,打開江西婺源

      房產要聞

      卷瘋了!最低殺到7字頭!手握30萬,海口樓市橫著走!

      藝術要聞

      乾隆 “翻車” 名畫刷屏!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 777精品久无码人妻蜜桃| 国产久一视频在线观看app| 日韩高清视频 一区二区| 国产传媒av| 爱爱福利社| 日韩精人妻无码一区二区三区| 亚洲a∨国产av综合av网站| 亚洲免费福利在线视频| 无码一区二区三区人| 中文字幕在线日亚州9| 色伊人亚洲综合网站| 色婷婷亚洲婷婷八月中文字幕| 一本一道波多野结衣一区二区 | 69国产| 精品国产中文一级毛片在线看| 国产清纯在线一区二区vr| 国产蜜臀av在线一区二区| 国产精品集合| 久久久精品2019中文字幕之3| 深夜国产成人福利在线观看女同 | 亚洲精品成人a在线观看| 亚洲欧美成人中文日韩电影网站| 国产精品微拍| 色猫咪免费人成网站在线观看| 日本高清va在线播放| www.91在线播放| 久久精品一区二区免费播放| 少妇av一区二区三区无码| 日韩在线观看精品亚洲| 操亚洲无码| 2021久久超碰国产精品最新| 在线视频夫妻内射| 一区二区亚洲精品国产精华液| 精品国产福利在线观看91啪| 精品无码久久久久久久动漫| 国产熟女在线播放第一页| 日韩精品无码一区二区三区| 贵溪市| 亚洲精品日韩在线观看| 一区二区三区av| 一区二区不卡国产精品|