<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      Science | 細菌比我們想的更“記仇”:AI發現85%的抗病毒武器從未被描述

      0
      分享至

      細菌跟噬菌體打了三十多億年的仗,怎么可能就靠這兩百來種武器?事實是,每次有人認真去篩,總能發現新東西。最近一篇發表在Science上的工作干脆用深度學習把這個問題推到了極限,他們訓練了三個互補模型,在3.2萬個細菌基因組里掃了一遍,預測出超過2百萬個抗噬菌體蛋白,其中85%以上的蛋白家族從未被任何研究關聯到免疫上。


      換句話說,我們對細菌免疫的了解,可能只是冰山浮出水面的那一小塊。

      研究背景與目的

      抗噬菌體防御系統有個讓人頭疼的特點:它們不怎么保守。不同細菌對付同一種病毒,可能拿出完全不同的蛋白質零件。這種多樣性一方面說明自然界解決問題的方案遠比實驗室里看到的豐富另一方面也讓傳統的“靠同源性找基因”的方法頻頻失靈。

      過去十年,研究者發現了一個規律:防御系統喜歡扎堆出現在基因組的特定區域,叫“防御島”。這就催生了一種“連帶定罪”策略:如果一個基因經常出現在已知防御基因旁邊,那它很可能也有防御功能。這個方法確實管用,過去五六年發現的系統大多靠這個思路。

      但它的局限也很明顯:只認熟面孔附近的人,對那些單打獨斗或者藏在病毒基因組里的防御系統,基本抓瞎。而且它需要一個蛋白家族至少有5個同源序列才能算,直接把大量“孤兒蛋白”排除在外。所以這篇文章的作者換了個思路:不靠規則,靠模式識別。

      三款模型,三種視角

      他們搞了三套深度學習模型,每一套的“偏見”不一樣。


      第一個叫ALBERTDF,是個基因組語言模型。你可以把它想象成一個學會了細菌“語法”的模型,給它看一段連續64個基因的序列,它要預測中間缺了哪個基因。訓練完之后,再拿它去判斷一個基因出現在某個上下文里是不是“可疑”(也就是像不像防御基因)。這個模型的優點是不看序列,所以哪怕一個蛋白長得跟所有已知防御系統都不像,只要它總出現在防御島里,模型就能抓到。缺點是詞匯量太大,整個細菌界的蛋白家族有800多萬個,模型根本裝不下,所以他們只在一個門(放線菌門)上跑了這個實驗。結果在10個預測的系統里驗證了6個,全是之前沒人知道有抗噬菌體功能的。

      第二個叫ESMDF,思路完全反過來。它用的是蛋白語言模型ESM2,輸入是一串氨基酸,輸出是這個蛋白“像不像防御蛋白”。這種模型天然能捕捉遠程同源關系,兩個蛋白序列相似度很低,但三維結構或功能域有共性,ESM也能感受到。他們拿32萬個基因組里的已知防御系統做正樣本,拿核心看家基因和移動元件里的非防御基因做負樣本,然后把模型微調成二分類器。650M參數的大版本在測試集上表現不錯,尤其讓人意外的是,哪怕那些在訓練集里幾乎沒出現過的防御亞型(比如某些罕見的逆轉錄子),模型也給打了高分。

      但最厲害的是第三個,GeneCLRDF。它是個雙通道模型,同時看兩樣東西:一個通道讀蛋白的氨基酸序列(用ESM-35M的預訓練嵌入),另一個通道讀這個蛋白周圍的64個基因的上下文。訓練目標很巧妙:讓模型學會把同一個蛋白的“序列視圖”和“上下文視圖”拉近,把不同蛋白的視圖推開。換句話說,模型被教會了一件事:一個蛋白長什么樣,應該跟它住在基因組哪個位置是一致的。

      這個設計的好處顯而易見:如果一個蛋白的序列看起來不像任何已知防御系統,但它的鄰居全是防御基因,模型就能通過上下文通道給它打高分;反過來,如果一個蛋白的序列特征很像防御蛋白,但被塞進了一個看家基因的上下文里,模型也不會輕易上當。在測試集上,GeneCLRDF做到了99%的精確率和92%的召回率,這意味著每100個被標記為“防御蛋白”的基因里,只有1個是假陽性;而所有真正的防御蛋白里,它能抓住92%。

      驗證:六個新系統從紙上走進培養皿

      兩輪實驗驗證了20個候選系統,其中12個具有真實的抗噬菌體功能。


      第一輪在放線菌中測試ALBERTDF的預測:10個候選里有6個有效,在Streptomyces albus中表達后使噬菌斑下降超過100倍。研究者給它們取了Ceres、Ukko等名字,其中既有帶核酸酶結構域的蛋白,也有僅幾十個氨基酸、功能完全未知的小蛋白。

      第二輪在大腸桿菌中測試ESM-650MDF的預測:同樣是10個候選6個有效,包括一個攜帶DUF7946結構域的系統,沒有任何已知防御同源物,卻能同時抵抗長尾、肌尾、短尾三類噬菌體。

      這些結果證明,模型學到的不是統計噪音,而是可實驗復現的真實生物學功能。

      全景圖:1.5%的基因組,85%的未知家族

      將GeneCLRDF應用于3.2萬個細菌基因組后,繪制出一張全新的免疫地圖。此前估計細菌約0.46%的基因為防御相關,新模型將這一比例拉高至1.53%,整整三倍。

      多樣性更為驚人:三個模型共預測61.5萬個防御相關蛋白家族,其中93%僅能被GeneCLRDF識別。超過40萬個家族沒有任何Pfam結構域注釋,連功能猜測都無從下手,是真正的“暗物質”。操作子層面,2.3萬個家族中超一半與任何已知防御系統無關。


      此外,新預測顯示防御系統與可移動遺傳元件的關聯更強(23.5% vs 之前的17.7%),約25%的整合子基因被標記為防御相關——細菌免疫系統是一個動態、流動的網絡,而非靜態防線。

      總結

      這項工作的價值不在于刷了幾個深度學習模型的分數,而在于它把“我們不知道細菌免疫到底有多復雜”這件事變成了一個可度量的、可操作的問題。61萬個蛋白家族、2.3萬個操作子家族、1.5%的基因組占比。這些數字給了一個明確的信號:過去三十年我們描述的那些系統,可能只是冰山浮出水面的尖尖。

      當然,預測歸預測。一個基因被模型打了高分,不代表它一定就是抗噬菌體的;即便它是,也不代表我們知道了它的機制。接下來要做的,是從這幾十萬個候選里挑出有意思的,一個個拿到實驗室里去驗證、去拆解、去搞清楚它到底怎么工作。

      好在作者把一切都開源了:分數、操作子家族、交互式圖譜,全部掛在DefenseFinder網站上。你不需要會寫代碼,也不需要懂深度學習,只要有一個感興趣的基因組或者一個好奇的結構域,就可以去里面翻一翻,說不定下一個被命名的防御系統就藏在里面。

      來源:Mordret E, Hervé A, et al. Protein and genomic language models uncover the unexplored diversity of bacterial immunity. Science. 2026 Apr 2;392(6793):eadv8275. doi: 10.1126/science.adv8275.


      主編微信

      注:添加微信請備注昵稱+單位+研究

      微信學科討論群:病毒學群,神經科學群、臨床醫學、腫瘤學科群、碩博交流群和醫藥投資交流群(微信群審核要求較高,請各位添加主編后主動備注單位研究方向)

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      5月14日,人社部公布2026年養老金調整方案了嗎?答案卻很反常

      5月14日,人社部公布2026年養老金調整方案了嗎?答案卻很反常

      社保小達人
      2026-05-14 11:17:52
      讓百姓在家門口能看好病(探訪)

      讓百姓在家門口能看好病(探訪)

      金臺資訊
      2026-05-14 06:39:43
      A股:大家系好安全帶了,不出意外的話,A股或將再次重演黑色星期四?

      A股:大家系好安全帶了,不出意外的話,A股或將再次重演黑色星期四?

      趨勢清風俠
      2026-05-14 12:37:47
      錢再多有什么用?2個女兒慘死3個兒子反目,資產1250億也無人送終

      錢再多有什么用?2個女兒慘死3個兒子反目,資產1250億也無人送終

      北緯的咖啡豆
      2026-04-08 17:09:30
      11年前優衣庫男女主現狀曝光,他們還在一起生了兩個孩子

      11年前優衣庫男女主現狀曝光,他們還在一起生了兩個孩子

      半糖甜而不膩
      2026-04-06 12:09:15
      U17國足VS沙特:4231最強出擊,萬項領銜前場進攻,海歸新星沖鋒

      U17國足VS沙特:4231最強出擊,萬項領銜前場進攻,海歸新星沖鋒

      零度眼看球
      2026-05-14 06:46:02
      國乒2人離隊!陣容大換血,孫穎莎最好閨蜜走了,王勵勤動真格了

      國乒2人離隊!陣容大換血,孫穎莎最好閨蜜走了,王勵勤動真格了

      寶哥精彩賽事
      2026-05-14 13:12:36
      爆大冷!0-1!巴薩轟然倒下,輸給保級隊,12億歐豪陣也沒用

      爆大冷!0-1!巴薩轟然倒下,輸給保級隊,12億歐豪陣也沒用

      足球狗說
      2026-05-14 05:23:40
      徹底撕破臉?國際足聯怒刪中文,攤牌談判籌碼,40億索賠倒計時

      徹底撕破臉?國際足聯怒刪中文,攤牌談判籌碼,40億索賠倒計時

      曉徙娛樂
      2026-05-14 11:00:32
      國安俱樂部做出重要決定!直接拍板同意球迷這個要求,引發熱議

      國安俱樂部做出重要決定!直接拍板同意球迷這個要求,引發熱議

      張麗說足球
      2026-05-14 14:09:53
      2026年養老金有望調整!高于7200漲60元,低于3800漲160可行嗎

      2026年養老金有望調整!高于7200漲60元,低于3800漲160可行嗎

      補懂事的孩紙
      2026-05-13 16:17:34
      他是外交部原部長,1985年被鄧小平怒批“胡說八道”,活到了98歲

      他是外交部原部長,1985年被鄧小平怒批“胡說八道”,活到了98歲

      歷史人文2
      2026-05-09 22:00:03
      韓國總統李在明會見何立峰

      韓國總統李在明會見何立峰

      每日經濟新聞
      2026-05-13 17:19:38
      3-2!騎士擊敗活塞,賽后還有4個好消息,哈登首冠有希望

      3-2!騎士擊敗活塞,賽后還有4個好消息,哈登首冠有希望

      王楔曉
      2026-05-14 13:22:07
      16個非常燒腦的悖論,真的要瘋了!

      16個非常燒腦的悖論,真的要瘋了!

      宇宙時空
      2026-05-12 22:30:07
      領先15分慘遭逆轉,加時輸掉天王山!CC空砍39+7+9,已突破500分

      領先15分慘遭逆轉,加時輸掉天王山!CC空砍39+7+9,已突破500分

      無術不學
      2026-05-14 11:59:17
      民營:不能永遠帶著原罪的鐐銬前行

      民營:不能永遠帶著原罪的鐐銬前行

      生命可以承受之輕
      2026-05-12 08:50:45
      特朗普和二兒媳又同框了!經常陪他出席各種活動,總統笑的太開心

      特朗普和二兒媳又同框了!經常陪他出席各種活動,總統笑的太開心

      冷桂零落
      2026-05-14 11:17:36
      病人問“驗血為何抽滿管”,網友質疑血液被倒賣,評論區一片恐慌

      病人問“驗血為何抽滿管”,網友質疑血液被倒賣,評論區一片恐慌

      譚談社會
      2026-05-13 03:24:58
      我只能跟著一起搖擺

      我只能跟著一起搖擺

      求實處
      2026-05-13 18:39:39
      2026-05-14 14:47:01
      生命科學前沿 incentive-icons
      生命科學前沿
      生命科學前沿 主編
      1034文章數 4459關注度
      往期回顧 全部

      科技要聞

      馬斯克說會談很順利 黃仁勛點贊 庫克比耶

      頭條要聞

      媒體:中美元首會晤 世界吃下一顆“定心丸”

      頭條要聞

      媒體:中美元首會晤 世界吃下一顆“定心丸”

      體育要聞

      登海報!哈登30+8+6創多項紀錄 第8次贏天王山

      娛樂要聞

      肖戰提名金海燕獎,這一步走得太穩

      財經要聞

      習近平同美國總統特朗普會談

      汽車要聞

      C級純電轎跑 吉利銀河"TT"申報圖來了

      態度原創

      數碼
      家居
      本地
      房產
      公開課

      數碼要聞

      PCIe 5.0固態硬盤僅在少數場景下有提升 不包括游戲

      家居要聞

      精神奢享 對話塔尖需求

      本地新聞

      用蘇繡的方式,打開江西婺源

      房產要聞

      海南樓市新政要出!擬調公積金貸款額度,最高可貸168萬!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 13小箩利洗澡无码视频网站免费| 国产最新一区二区三区天堂| 久久99精品国产99久久6男男| 国内精自线i品一区202| 国产精品国产三级国快看| 婷婷五月激情综合| 国产不卡在线拍揄自揄| 人妻少妇偷人一区二区| 樱花飘落视频素材| 久久夜色精品国产尤物| 日本一本免费一二区| 日本不卡1234| 色先锋av资源中文字幕| 欧美黑人粗暴多交高潮水最多| 不卡动漫av| 蜜桃视频一区二区三区在线| 欧美日韩在线第一页免费观看| 中文字幕人妻偷伦在线视频| 日本无遮挡吸乳视频| 少妇无码av无码去区钱| 亚洲av激情一区二区三区| 一 级 黄 色 片免费网站 | 国产精品久久久久不卡绿巨人| 亚洲无码视频在线播放| 伊人色影院| 免费无码又爽又刺激网站直播| 亚洲高清国产拍精品青青草原 | 色吊丝av中文字幕| 久久一夜天堂av一区二区| 色偷偷噜噜噜亚洲男人| 日韩在线一区二区不卡视频| 国产精品VA尤物在线观看| www.色色资源| 久久99久久99精品免视看| 亚洲精品国男人在线视频| 性感少妇在线观看| 国产v精品成人免费视频71pao| 精品人体无码一区二区三区| 国产精品自在欧美一区| 草草浮力地址线路①屁屁影院| 亚洲日本va午夜中文字幕|