<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      大語言模型:從注意力機制到智能體時代丨面向復雜系統的人工智能第六講

      0
      分享至


      導語

      集智俱樂部、集智學園創始人,北京師范大學張江教授開設了,致力于打破學科壁壘,將復雜系統與人工智能深度融合。從神經網絡到因果推斷,從世界模型到多尺度建模,甚至包含最前沿的“氛圍編程(Vibe Coding)”實戰,帶你親手落地AI項目。

      作為系列課程的第六講,張江教授將以「大語言模型:從注意力機制到智能體時代」為題,講解Transformer模型,大語言模型預訓練與微調,以及現在新的技術趨勢。正式分享將于4月13日(周一)13:30-16:15騰訊會議線上直播,北師大海淀區線下授課(助教可協助入校)。

      課程簡介

      ChatGPT背后的核心機制,Transformer注意力已成為當代AI基礎設施的核心組件,這套架構在過去七年里驅動了整個領域的能力跳躍。理解它,就是理解當前大模型能力的物理邊界在哪里。

      本節課程從語言模型三十年的演進史出發,系統拆解大語言模型的運作原理。課程沿兩條主線推進:一條是機制主線,從注意力機制的幾何直覺(如何用Query-Key-Value構造有向信息網絡),到Transformer編解碼器的完整架構,再到GPT系列的訓練流程(預訓練→指令微調→RLHF);另一條是前沿主線,大模型的涌現能力、思維鏈推理、推理時計算擴展規律,以及DeepSeek-R1用GRPO替代PPO的技術路線。

      學完這門課,你能讀懂“Attention is All You Need”的推導,能解釋ChatGPT與DeepSeek的技術異同,能區分Prompt Engineering、Context Engineering與Harness Engineering三個工程層次,并具備從Prompt到API調用搭建LLM應用的基礎能力。

      課程大綱

      1. 認識大語言模型

        1. 語言模型三十年演進:n-gram統計模型→Word2Vec神經語言模型→預訓練LM(BERT/GPT)→LLM→多模態智能體

        2. LLM的六種使用方式:Prompt、應用集成、私有知識庫、AI Agent、Fine-tune、Train的適用場景與難度對比

        3. 上下文學習(In-context Learning)與指令學習(Instruction Learning)

        4. Prompt Engineering、Context Engineering及GPT API調用實踐

      2. Transformer架構

        1. 信息聚合視角:全連接、卷積(局域聚合)、圖神經網絡的對比

        2. Query-Key-Value注意力

        3. 多頭注意力(Multi-head Attention)、Layer Norm、Position-wise Feedforward

        4. 正弦余弦位置編碼(Positional Encoding)及其設計動機

        5. Transformer編碼器-解碼器完整架構與PyTorch源碼解析

        6. In-context learning的數學本質:注意力機制等價于隱式梯度下降

      3. GPT與DeepSeek

        1. GPT-1到GPT-4的技術演進:Decoder-only架構、參數規模爆增、in-context learning、多模態能力

        2. ChatGPT訓練流程:預訓練(Base Model)→監督微調(SFT)→獎勵建模→RLHF/PPO對齊

        3. 指令微調(Instruct Tuning)與人類反饋強化學習(RLHF)

        4. DeepSeek-V3:MATH-500達90.2分,極低推理成本的性能-價格帕累托最優

        5. DeepSeek-R1與GRPO:以組策略優化替代PPO,無需獨立價值網絡

      4. 新趨勢

        1. 大模型涌現能力:規模突破臨界值后的能力突現

        2. 思維鏈(Chain of Thought)推理與推理時計算擴展定律(Inference Scaling Laws)

        3. AI Agents:自主性、任務特定性、反應性三要素

        4. Harness Engineering:Prompt→Context→Harness的工程范式演進,信息層/執行層/反饋層三層架構



      關鍵術語

      1. Transformer:基于多頭自注意力的序列建模架構,摒棄RNN的遞歸結構,當前主流LLM的核心組件

      2. 自注意力(Self-attention):序列每個位置對所有位置計算注意力權重,實現全局信息聚合;公式:Attention=softmax(QK^T/√d?)V

      3. RLHF:基于人類反饋的強化學習,通過人工偏好標注訓練獎勵模型,再用PPO優化LLM輸出

      4. GRPO:DeepSeek-R1采用的強化學習算法,以組策略優化替代PPO,省去獨立價值網絡

      5. In-context Learning(ICL):無需更新參數,僅在提示中提供少量示例引導LLM完成任務;數學上等價于注意力層的隱式梯度下降

      6. 涌現能力(Emergent Abilities):LLM參數規模突破閾值后突然具備的新能力

      7. Positional Encoding:將位置信息注入詞嵌入,彌補注意力機制對序列順序不敏感的缺陷

      8. Harness Engineering:2026年興起的智能體系統工程范式,整合Memory、Tools、Orchestration、Guardrails、Evaluation等組件于Prompt之上

      9. 幻覺(Hallucination):LLM生成與事實不符內容的現象,研究顯示約64%的LLM錯誤由此引發


      課程信息

      課程主題:大語言模型:從注意力機制到智能體時代

      課程時間:2026年4月13日(周一) 13:30-16:15

      課程形式:騰訊會議(會議信息見群內通知)/北師大海淀區線下授課(助教可協助入校);集智學園網站錄播(3個工作日內上線)

      課程主講人

      張江,北京師范大學系統科學學院教授,集智俱樂部、集智學園創始人,集智科學研究中心理事長,曾任騰訊研究院、華為戰略研究院等特聘顧問。主要研究領域包括因果涌現、復雜系統分析與建模、規模理論等。

      個人主頁:https://jake.swarma.org/

      課程適用對象

      1. 理工科背景高年級本科生

      2. 理工科背景碩士、博士研究生


      報名須知

      1. 課程形式:

      1. 參與方式:付費學員可參與騰訊會議直播/北師大海淀區線下授課(助教可協助入校)

      2. 授課形式:

      1. 平時:課堂討論與內容共創

      2. 結課:項目匯報

      2. 課程周期:2026年3月2日-2026年6月22日,每周一 13:30-16:15進行。

      3. 課程定價:399元

      課程鏈接:https://campus.swarma.org/v3/course/5684?from=wechat

      付費流程:

      1. 課程頁面添加學員登記表,添加助教微信入群;

      2. 課程可開發票。

      課程共創任務:課程字幕

      為鼓勵學員深度參與、積極探索,我們致力于形成系列化知識傳播成果,并構建課程知識共建社群。為此,我們特別設立激勵機制,讓您的學習之旅滿載收獲與成就感。

      課程以老師講授為主,每期結束后,助教會于課程群內發布字幕共創任務。學員通過參與這些任務,不僅能加深對內容的理解,還可獲得積分獎勵。積分可兌換其他讀書會課程或實物獎品,助力您的持續成長。

      推薦課程

      參考課程

      1. 吳恩達:Build with Andrew https://www.deeplearning.ai/courses/build-with-andrew/

      2. Jure Leskovec: Machine Learning with Graphs, StanfordCS224W.https://www.youtube.com/playlist?list=PLoROMvodv4rPLKxIpqhjhPgdQy7imNkDn

      3. Steve Brunton: Data Driven Science and Engineering, University of Washingtonhttps://www.youtube.com/playlist?list=PLMrJAkhIeNNRpsRhXTMt8uJdIGz9-X_1-

      4. Karthik Duraisamy: DATA-DRIVEN ANALYSIS AND MODELING OF COMPLEX SYSTEMS, Michigen institute for computational discovery and engineering, Michigen University.https://micde.umich.edu/academic-programs-old/data-driven-course/

      5. Sergey Levine: Deep Reinforcement Learning, CS 285 at UC Berkeley.http://rail.eecs.berkeley.edu/deeprlcourse/

      【集智學園網站資源】

      1. 對復雜系統連續變化自動建模——Neural Ordinary Differential Equations解讀https://campus.swarma.org/course/2046

      2. 復雜網絡自動建模在大氣污染中的應用https://campus.swarma.org/course/1998

      3. 兩套因果框架深度剖析:潛在結果模型與結構因果模型https://campus.swarma.org/course/2526

      4. 穩定學習:發掘因果推理和機器學習的共同基礎https://campus.swarma.org/course/2323

      5. 因果強化學習https://campus.swarma.org/course/2156

      6. 張江:因果與機器學習能夠破解涌現之謎嗎https://campus.swarma.org/course/4540

      7. 因果涌現理論提出者:Erik Hoel主題報告https://campus.swarma.org/course/4317

      8. 如何從數據中發現因果涌現——神經信息壓縮器https://campus.swarma.org/course/4874

      9. 標準化流技術簡介https://campus.swarma.org/course/1999

      10. 帶隱狀態的強化學習世界模型https://campus.swarma.org/course/4848

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      杜聿明晚年談到孫立人:他不是民族英雄,他就是賣主求榮的小人

      杜聿明晚年談到孫立人:他不是民族英雄,他就是賣主求榮的小人

      小莜讀史
      2026-05-11 22:19:40
      “超短裙配蕾絲襪?”女教師穿搭被舉報,這次穿的算保守了!

      “超短裙配蕾絲襪?”女教師穿搭被舉報,這次穿的算保守了!

      知曉科普
      2026-03-23 15:58:04
      佛山一區拿下民宿界大獎,成為年度最具投資潛力目的地

      佛山一區拿下民宿界大獎,成為年度最具投資潛力目的地

      南方都市報
      2026-05-11 18:06:19
      奶奶剛死3天,瞎子上門討飯,臨走時說:明天你們家要多一口棺材

      奶奶剛死3天,瞎子上門討飯,臨走時說:明天你們家要多一口棺材

      千秋文化
      2026-04-27 20:12:24
      這一年王祖賢才4歲,兄妹倆臉型長得真像,一看就是親兄妹

      這一年王祖賢才4歲,兄妹倆臉型長得真像,一看就是親兄妹

      大江
      2026-05-06 20:23:09
      李賽鳳的亂倫,床縫摸出個用過的套,衣柜里還藏著個半裸的干兒子

      李賽鳳的亂倫,床縫摸出個用過的套,衣柜里還藏著個半裸的干兒子

      西樓知趣雜談
      2026-04-26 10:18:11
      08年,大連烏蟒島有多恐怖?科考隊下崖底勘查,眼前一幕難以相信

      08年,大連烏蟒島有多恐怖?科考隊下崖底勘查,眼前一幕難以相信

      天夢見證
      2025-03-15 16:46:12
      汪小菲帶兒女去公園散心!玥兒雙手叉腰站最后,馬筱梅消瘦不少

      汪小菲帶兒女去公園散心!玥兒雙手叉腰站最后,馬筱梅消瘦不少

      阿傖說事
      2026-05-11 22:38:00
      有沒有人敢爆自己的瓜?網友:確定玩這么大嗎?

      有沒有人敢爆自己的瓜?網友:確定玩這么大嗎?

      夜深愛雜談
      2026-02-18 20:55:58
      水谷隼:日本隊要想戰勝中國隊,必須要好好研究孫穎莎

      水谷隼:日本隊要想戰勝中國隊,必須要好好研究孫穎莎

      懂球帝
      2026-05-10 22:57:36
      雨神去代孕求子了?蔡文靜賬號被沒收?龔俊補習?田嘉瑞受歡迎?姨太問答

      雨神去代孕求子了?蔡文靜賬號被沒收?龔俊補習?田嘉瑞受歡迎?姨太問答

      毒舌扒姨太
      2026-05-10 22:38:11
      山東男籃收官放假:四外援離隊待重構,本土三叉戟錨定未來!

      山東男籃收官放假:四外援離隊待重構,本土三叉戟錨定未來!

      老周觀體育
      2026-05-11 23:47:01
      “為什么我的媽媽這么老?”9歲女孩因媽媽年齡情緒崩潰,太唏噓

      “為什么我的媽媽這么老?”9歲女孩因媽媽年齡情緒崩潰,太唏噓

      妍妍教育日記
      2026-04-30 20:05:20
      1954年,東北局五人一夜被免職,25年后,當年指控他們的人道歉

      1954年,東北局五人一夜被免職,25年后,當年指控他們的人道歉

      顧史
      2026-05-11 10:33:54
      80歲以后,來日不多了,就算身體再好,也請記住這7句話

      80歲以后,來日不多了,就算身體再好,也請記住這7句話

      荷蘭豆愛健康
      2026-05-09 00:02:04
      奉勸大家:這6樣東西千萬“別用紙巾擦”,一擦就壞,很難修復

      奉勸大家:這6樣東西千萬“別用紙巾擦”,一擦就壞,很難修復

      室內設計師有料兒
      2026-05-06 12:09:03
      《亢奮》第三季爭議鏡頭曝光,劇組內部曾激烈反對

      《亢奮》第三季爭議鏡頭曝光,劇組內部曾激烈反對

      影視情報室
      2026-05-11 00:33:52
      74歲法國候選人攤牌:敢介入臺海就直面核彈,法國一枚都承受不起

      74歲法國候選人攤牌:敢介入臺海就直面核彈,法國一枚都承受不起

      杰絲聊古今
      2026-05-11 23:03:08
      西安交警通報“男子駕駛摩托車國道上逆行致1死”:楊某涉嫌交通肇事罪,正進一步調查

      西安交警通報“男子駕駛摩托車國道上逆行致1死”:楊某涉嫌交通肇事罪,正進一步調查

      封面新聞
      2026-05-11 17:36:05
      趙心童、吳宜澤助陣,中國臺球俱樂部聯賽開啟職業化新征程

      趙心童、吳宜澤助陣,中國臺球俱樂部聯賽開啟職業化新征程

      新京報
      2026-05-11 09:51:10
      2026-05-12 00:59:00
      集智俱樂部 incentive-icons
      集智俱樂部
      科普人工智能相關知識技能
      5814文章數 4674關注度
      往期回顧 全部

      科技要聞

      黃仁勛:你們趕上了一代人一次的大機會

      頭條要聞

      母女二人一年用水量高達400多噸 警方發現背后隱情

      頭條要聞

      母女二人一年用水量高達400多噸 警方發現背后隱情

      體育要聞

      梁靖崑:可能是最后一屆了,想讓大家記住這個我

      娛樂要聞

      “孕婦墜崖案”王暖暖稱被霸凌協商解約

      財經要聞

      宗馥莉罷免銷售負責人 部分業務將外包

      汽車要聞

      吉利銀河“TT”申報圖曝光 電動尾翼+激光雷達

      態度原創

      家居
      時尚
      本地
      藝術
      數碼

      家居要聞

      多元生活 此處無聲

      今年夏天最流行的5雙涼鞋,配裙子絕美!

      本地新聞

      用蘇繡的方式,打開江西婺源

      藝術要聞

      震撼!Nicole Nodland鏡頭下的絕美時尚女神!

      數碼要聞

      還原macOS安全性邏輯:為什么黑客越來越難攻破Mac?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 欧美丰满熟妇bbbbbb百度 | 成人无码h真人在线网站| 色福利网| 999zyz玖玖资源站在线观看| 精品无码国产一区二区三区av| 色婷婷综合久久久久中文字幕| 国产精品成人一区二区不卡| 无码人妻丰满熟妇啪啪网站| 在线看国产精品自拍内射| 人妻无码| 人妻色图| 97se亚洲综合在线韩国专区福利| 国产精品自在在线午夜| 久久av高潮av无码av喷吹| 欧洲极品少妇| 国产精品美女一区二区免费视频| 国产成人精品日本亚洲专区6| 欧美一区二区最爽乱淫视频免费看| 色婷婷综合久久久中文字幕| AV制服丝袜无码一区二区| 中文字幕国产原创国产| 亚洲一区二区AV| 久草福利资源站| 国产av熟女一区二区三区| 99蜜桃臀久久久欧美精品网站| 少妇综合网| 国产免费午夜精品理论| 精品视频第一页| 99re国产高清| 999re6在热线视频| 精品国精品国产自在久国产87| 美女久久久久久| 日韩乱码人妻无码中文字幕| 国产精品水嫩水嫩| 欧美成人看片一区二区| 欧美俄罗斯40老熟妇| 午夜在线不卡| www.操| 国产suv精品一区二区33| 国产成人8X人网站视频| 中文字幕久荜|