天文學(xué)家最近干了一件聽(tīng)起來(lái)很科幻的事:讓AI去翻NASA的"舊賬",結(jié)果從兩百萬(wàn)顆恒星的觀測(cè)數(shù)據(jù)里,挖出了100多個(gè)以前沒(méi)確認(rèn)的行星,其中31個(gè)是全新的世界。
這件事的有趣之處在于,它不是什么"未來(lái)科技"——用的全是TESS衛(wèi)星已經(jīng)拍好的照片,只是以前沒(méi)人(也沒(méi)工具)能這么快地看完、看懂。
![]()
TESS全稱"凌日系外行星巡天衛(wèi)星",是NASA2018年發(fā)射的太空望遠(yuǎn)鏡。它的工作方式很樸素:盯著一大片天空,記錄恒星的亮度變化。如果某顆恒星突然暗了一點(diǎn)點(diǎn),可能是有一顆行星從它前面"路過(guò)",擋住了極少的光。這種亮度下降通常不到1%,人眼根本看不出來(lái),但對(duì)儀器來(lái)說(shuō)是個(gè)信號(hào)。
問(wèn)題是,TESS每秒都在產(chǎn)生海量數(shù)據(jù)。第一年的觀測(cè)就覆蓋了兩百多萬(wàn)顆恒星,后面幾年還在持續(xù)掃描。傳統(tǒng)方法是天文學(xué)家手動(dòng)篩選這些"光變曲線",判斷哪些是真正的行星,哪些是假信號(hào)——比如兩顆恒星互相繞轉(zhuǎn)、互相遮擋造成的"食雙星",看起來(lái)和行星過(guò)境幾乎一模一樣。
華威大學(xué)的天文學(xué)家團(tuán)隊(duì)做了一個(gè)叫RAVEN的AI工具來(lái)解決這個(gè)瓶頸。RAVEN的核心思路是:先造一批"假數(shù)據(jù)"來(lái)訓(xùn)練模型。團(tuán)隊(duì)模擬了幾十萬(wàn)個(gè)真實(shí)的行星信號(hào),以及同樣數(shù)量的假信號(hào)(食雙星、儀器噪聲、恒星自身亮度波動(dòng)等),讓機(jī)器學(xué)習(xí)區(qū)分這兩者的細(xì)微差別。
訓(xùn)練完成后,RAVEN被投喂了TESS前四年的全部數(shù)據(jù)。結(jié)果它篩出了超過(guò)2000個(gè)高質(zhì)量的行星候選體,其中近1000個(gè)是此前從未被標(biāo)記過(guò)的。經(jīng)過(guò)后續(xù)驗(yàn)證,最終確認(rèn)了118顆新行星,包括31個(gè)此前完全未知的世界。
論文第一作者M(jìn)arina Lafarga Magro博士說(shuō),這是目前對(duì)"短周期行星"最精確的一次普查。團(tuán)隊(duì)特意關(guān)注了軌道周期小于16天的行星——也就是那些緊緊貼著恒星、一年比我們的一天還短的極端世界。
這類行星之所以重要,有幾個(gè)原因。首先,它們最容易被TESS發(fā)現(xiàn):離恒星近意味著過(guò)境頻率高,16天的周期在幾年的觀測(cè)里能重復(fù)很多次,信號(hào)累積得更可靠。其次,它們代表了行星形成和演化的一種極端情況。按照目前的理論,行星在靠近恒星的地方很難存活:恒星輻射會(huì)吹散大氣,潮汐力會(huì)扭曲軌道。但觀測(cè)表明這類行星并不少見(jiàn),說(shuō)明要么形成機(jī)制和我們想的不一樣,要么它們是從更遠(yuǎn)的地方遷移過(guò)來(lái)的。
這次發(fā)現(xiàn)里還有幾個(gè)特別有趣的類別。一類是"超短周期行星",公轉(zhuǎn)周期不到24小時(shí)——比地球自轉(zhuǎn)一圈還快。目前已知的這類行星只有幾十顆,每一個(gè)都是檢驗(yàn)理論的珍貴樣本。另一類位于所謂的"海王星沙漠":這是一個(gè)軌道距離上的特殊區(qū)域,按照模型應(yīng)該很少有中等質(zhì)量的行星存在,因?yàn)楹阈禽椛鋾?huì)把它們的大氣層剝光,最后只剩下巖石核心。但RAVEN在這里找到了一些漏網(wǎng)之魚,說(shuō)明"沙漠"可能沒(méi)我們想的那么荒涼。
還有一些是多行星系統(tǒng)。RAVEN識(shí)別出了幾對(duì)此前未知的行星"室友"——兩顆行星共用同一顆恒星,軌道周期不同但都很短。這種緊密排列的系統(tǒng)對(duì)軌道穩(wěn)定性要求極高,是研究行星間引力相互作用的天然實(shí)驗(yàn)室。
說(shuō)到這里,可能有人會(huì)問(wèn):AI介入天文學(xué),會(huì)不會(huì)漏掉什么?這是個(gè)好問(wèn)題。RAVEN的設(shè)計(jì)其實(shí)保留了人工復(fù)核的環(huán)節(jié)——AI負(fù)責(zé)從兩百萬(wàn)顆恒星里快速縮小范圍,但最終確認(rèn)仍然需要傳統(tǒng)的天文分析,包括地面望遠(yuǎn)鏡的跟進(jìn)觀測(cè)。論文里也提到,RAVEN的模擬訓(xùn)練集是基于"我們已知的行星類型",如果存在某種完全超出預(yù)期的信號(hào)形態(tài),它確實(shí)可能錯(cuò)過(guò)。
不過(guò)就目前而言,這種"AI初篩+人工精修"的模式,已經(jīng)把行星確認(rèn)的效率提升了一個(gè)數(shù)量級(jí)。TESS的設(shè)計(jì)壽命原本是兩年,現(xiàn)在已經(jīng)超期服役到第八年,積累的數(shù)據(jù)還在增長(zhǎng)。沒(méi)有自動(dòng)化工具,這些觀測(cè)資源很大程度上是沉睡的。
另一個(gè)值得玩味的點(diǎn)是,這次發(fā)現(xiàn)完全是"數(shù)據(jù)再利用"。TESS前四年的觀測(cè)早已公開(kāi),全球任何研究者都可以下載。RAVEN的價(jià)值不在于拿到獨(dú)家數(shù)據(jù),而在于用新的分析方法從舊數(shù)據(jù)里榨取出新信息。這在天文學(xué)里越來(lái)越常見(jiàn):開(kāi)普勒衛(wèi)星退役多年后,仍有團(tuán)隊(duì)用改進(jìn)的算法從中發(fā)現(xiàn)新行星;SDSS(斯隆數(shù)字巡天)的星系光譜發(fā)布二十年了,至今每年還有上百篇論文基于這些數(shù)據(jù)發(fā)表。
某種程度上,這反映了現(xiàn)代天文學(xué)的一個(gè)轉(zhuǎn)向:觀測(cè)設(shè)備的建設(shè)周期以十年計(jì),但數(shù)據(jù)分析方法的迭代速度是年甚至月。同樣的望遠(yuǎn)鏡,用2020年的算法和2026年的算法,能看到的東西可能完全不同。RAVEN這類工具的出現(xiàn),相當(dāng)于給現(xiàn)有的觀測(cè)設(shè)施裝上了"新眼睛"。
當(dāng)然,確認(rèn)118顆行星本身不會(huì)改變我們對(duì)宇宙的認(rèn)知框架。真正有意思的是這個(gè)樣本的統(tǒng)計(jì)特征:短周期行星到底有多常見(jiàn)?海王星沙漠的邊界在哪里?多行星系統(tǒng)的軌道分布遵循什么規(guī)律?這些問(wèn)題的答案,需要把RAVEN的發(fā)現(xiàn)和此前的巡天結(jié)果拼在一起,才能看出趨勢(shì)。
論文發(fā)表在《皇家天文學(xué)會(huì)月刊》(MNRAS)上,這是一個(gè)有著近兩百年歷史的期刊,在天體物理領(lǐng)域以嚴(yán)謹(jǐn)著稱。選擇在這里發(fā)表,而不是追求更快的預(yù)印本平臺(tái),說(shuō)明團(tuán)隊(duì)對(duì)結(jié)果的可重復(fù)性和細(xì)節(jié)披露有較高要求——這也是AI介入科學(xué)研究時(shí)的一個(gè)微妙考量:當(dāng)發(fā)現(xiàn)過(guò)程涉及復(fù)雜的機(jī)器學(xué)習(xí)模型,審稿人和讀者需要足夠的信息來(lái)判斷,這個(gè)"黑箱"里到底發(fā)生了什么。
最后說(shuō)一個(gè)輕松的細(xì)節(jié)。RAVEN這個(gè)名字,在英語(yǔ)里是"渡鴉"的意思。在北歐神話里,渡鴉是奧丁的耳目,每天飛遍世界帶回信息。給行星搜索工具起這個(gè)名字,倒是挺貼切的——只不過(guò)這只"渡鴉"的飛行范圍是數(shù)據(jù)空間,它的"世界"是兩百萬(wàn)顆恒星的亮度變化,而它帶回來(lái)的"信息",是118個(gè)遙遠(yuǎn)世界的存在證明。
這些世界里,最近的也在幾十光年之外,最遠(yuǎn)的超過(guò)一千光年。以人類目前的航行能力,到達(dá)任何一個(gè)都是不可能的任務(wù)。但知道它們?cè)谀抢铮浪鼈円圆坏揭惶斓臅r(shí)間瘋狂繞轉(zhuǎn),知道有些僥幸生存在理論上不該存在的區(qū)域——這種"知道"本身,就是天文學(xué)能提供的某種慰藉。宇宙很大,但我們正在學(xué)會(huì)閱讀它的跡象,一顆星一顆星地,把地圖補(bǔ)全。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.