人工智能(Artificial Intelligence,簡(jiǎn)稱AI)就是用機(jī)器來模擬人類認(rèn)知能力的技術(shù),主要包括感知、學(xué)習(xí)、預(yù)測(cè)推理和決策等方面的能力。2016年3月,運(yùn)用了人工智能“深度學(xué)習(xí)”技術(shù)的計(jì)算機(jī)程序AlphaGo在與圍棋世界冠軍李世石的對(duì)戰(zhàn)中輕松獲勝,人工智能也隨之開始受到越來越多的關(guān)注。近年來,由于AI的賦能,智慧教育、智慧醫(yī)療、智慧安防、自動(dòng)駕駛汽車、物聯(lián)網(wǎng)等行業(yè)和領(lǐng)域獲得了蓬勃發(fā)展。
(圖片來自網(wǎng)絡(luò))
一、AI在天文數(shù)據(jù)的處理方面大顯身手
由于天文技術(shù)的進(jìn)步,天文學(xué)中出現(xiàn)了海量的數(shù)據(jù),已經(jīng)遠(yuǎn)遠(yuǎn)超過TB,達(dá)到PB的量級(jí)。天文學(xué)家們要想從LAMOST、FAST、LSST、VST、cssT等大型望遠(yuǎn)鏡的海量數(shù)據(jù)中找出有價(jià)值的信息,需要耗費(fèi)很多的時(shí)間和精力。高效地處理這些數(shù)據(jù),已經(jīng)成了天文學(xué)家們面臨的一道難題。于是,由于其在海量數(shù)據(jù)分析和處理方面所具有的突出優(yōu)勢(shì),人工智能很自然地走入了天文學(xué)家的視野。
2017年,NASA宣布他們利用google AI發(fā)現(xiàn)了“第二個(gè)太陽(yáng)系”,而且所處天體是我們所在的太陽(yáng)系之外首個(gè)已知的八行星恒星系統(tǒng)。人工智能手段參與系外行星的搜尋,并且首次為人類找出此前被遺漏的行星,人工智能方法體現(xiàn)出來的效率和準(zhǔn)確性遠(yuǎn)超傳統(tǒng)的分析方法。
二、引力透鏡——宇宙中的“放大鏡”
顧名思義,引力透鏡就是由引力引起的透鏡效應(yīng),它是宇宙中天然的“放大鏡”,可以讓我們看清遙遠(yuǎn)的天體。引力透鏡的概念最初是在愛因斯坦的廣義相對(duì)論中提出的,它是指一種大質(zhì)量物體改變其周圍時(shí)空特性,從而使光線在其附近傳播時(shí)路徑發(fā)生彎折的現(xiàn)象。
1979年,三位天文學(xué)家Walsh,Carswell和Weymann發(fā)現(xiàn)有兩顆類星體離得非常近,通過測(cè)量它們的光譜,三位科學(xué)家證實(shí)這兩個(gè)圖像是來自同一天體。從此以后,引力透鏡才真正被天文學(xué)家們所廣泛接受,今天已經(jīng)成為天文學(xué)中的一項(xiàng)重要工具。
在引力透鏡事件中,觀測(cè)者從地球上觀測(cè)非常遙遠(yuǎn)的發(fā)光天體,或者說背景天體,在觀測(cè)者和背景天體中間還有一個(gè)處于中間位置的天體,在中間的這個(gè)天體質(zhì)量要足夠大,而且恰好處在觀測(cè)者和背景天體的連線附近。這樣背景天體發(fā)出的光在經(jīng)過中間天體附近的時(shí)候,傳播路徑在中間天體引力場(chǎng)的作用下發(fā)生偏折,就像我們拿著放大鏡看遙遠(yuǎn)的背景天體一樣。
天文學(xué)上研究引力透鏡一般分為三個(gè)大的方向:一是強(qiáng)引力透鏡,當(dāng)這三者比較好的處在一條直線上;二是弱引力透鏡,就是這三者沒有特別好的連在一條直線上;三是微引力透鏡,主要是研究這三者在視覺上有明顯相對(duì)運(yùn)動(dòng)的情況。
弱引力透鏡在宇宙天空中幾乎無處不在。而強(qiáng)透鏡和微透鏡就是非常稀少的事件了。星系和星系團(tuán)的引力場(chǎng)可以造成非常強(qiáng)的折射,因此我們可以看到背景天體發(fā)生非常明顯的形變。比如背景天體是一個(gè)星系的話,我們可能看到它被扭曲成一條弧形甚至一個(gè)完整的圓環(huán)(愛因斯坦光環(huán));如果背景天體是致密的點(diǎn)源,比如類星體的話,我們可能看到它的兩個(gè)像,甚至四個(gè)像(愛因斯坦十字)。這就是強(qiáng)引力透鏡現(xiàn)象。
強(qiáng)引力透鏡示意圖(圖片來自網(wǎng)絡(luò))
愛因斯坦光環(huán)(圖片來源:NASA/ESA)
愛因斯坦十字(圖片來源:NASA/ESA)
三、AI助力搜尋強(qiáng)引力透鏡候選體
星系尺度的強(qiáng)引力透鏡系統(tǒng)是重要的宇宙學(xué)探針,可用于深入地研究宇宙學(xué)和天體物理中的諸多科學(xué)問題,如暗物質(zhì)性質(zhì)、星系形成和演化以及哈勃常數(shù)的測(cè)量等。然而,目前已證認(rèn)的強(qiáng)透鏡系統(tǒng)數(shù)目過少,嚴(yán)重制約了相關(guān)天體物理學(xué)問題研究的開展。
如何搜尋證認(rèn)更多強(qiáng)透鏡樣本是當(dāng)前研究中的一個(gè)主要問題。通過下一代大規(guī)模測(cè)光巡天項(xiàng)目的開展,我們有望發(fā)現(xiàn)數(shù)以萬計(jì)的強(qiáng)透鏡系統(tǒng)。但如何才能在海量的天體圖像中快速地找到強(qiáng)透鏡候選體呢?近期,中國(guó)科學(xué)院云南天文臺(tái)與云南大學(xué)西南天文研究所的研究人員合作構(gòu)建并訓(xùn)練了一個(gè)卷積神經(jīng)網(wǎng)絡(luò),用來尋找強(qiáng)引力透鏡系統(tǒng)。
該神經(jīng)網(wǎng)絡(luò)被應(yīng)用于歐洲南方天文臺(tái)2.6米巡天望遠(yuǎn)鏡(VST)千平方度巡天(Kilo-Degree Survey—KiDS)數(shù)據(jù),發(fā)現(xiàn)了38個(gè)新的強(qiáng)透鏡候選體。論文發(fā)表在英國(guó)《皇家天文學(xué)會(huì)月刊》上。
發(fā)現(xiàn)的38個(gè)強(qiáng)透鏡候選體中的4個(gè)(圖片來源:KiDS巡天)
四、AI如何幫助搜尋強(qiáng)透鏡候選體?
卷積神經(jīng)網(wǎng)絡(luò)是AI領(lǐng)域的重要技術(shù),它的廣泛應(yīng)用是近年來AI迅速發(fā)展的關(guān)鍵之一。相比普通神經(jīng)網(wǎng)絡(luò),卷積神經(jīng)網(wǎng)絡(luò)可以充分提取數(shù)據(jù)中的空間不變性特征,多層卷積可以實(shí)現(xiàn)從底層特征到高層特征的復(fù)合。卷積神經(jīng)網(wǎng)絡(luò)這些特點(diǎn)非常有利于引力透鏡的識(shí)別。
由于引力透鏡的特殊性,神經(jīng)網(wǎng)絡(luò)的泛化能力十分重要,為此,該網(wǎng)絡(luò)訓(xùn)練有別于一般網(wǎng)絡(luò),主要使用天文學(xué)家根據(jù)理論模型生產(chǎn)的模擬數(shù)據(jù)進(jìn)行訓(xùn)練,由于模擬數(shù)據(jù)包含了天文工作者多年的經(jīng)驗(yàn),并且可以任意生成,多樣性和全面性遠(yuǎn)大于人工標(biāo)注數(shù)據(jù),結(jié)合定制的訓(xùn)練方法,該神經(jīng)網(wǎng)絡(luò)的泛化能力得到了極大提高。
為了方便天文工作者使用和改進(jìn)該網(wǎng)絡(luò),新型科學(xué)計(jì)算語(yǔ)言Julia被用來構(gòu)建神經(jīng)網(wǎng)絡(luò)模型。相比C/C++或Python語(yǔ)言,Julia語(yǔ)言同時(shí)兼顧了速度和靈活性。由于其靈活性,研究人員很方便地定制了適合引力透鏡數(shù)據(jù)特點(diǎn)的小型網(wǎng)絡(luò),有效地抑制了過擬合現(xiàn)象。
最終,該網(wǎng)絡(luò)在CPU和GPU上都表現(xiàn)出良好的性能,并且可以任意切換,在普通PC上就可以運(yùn)行,不需要依賴大型GPU集群,非常有利于天文研究工作者實(shí)時(shí)修改、訓(xùn)練和測(cè)試網(wǎng)絡(luò)。
有意思的是,研究人員發(fā)現(xiàn),在訓(xùn)練計(jì)算機(jī)時(shí),非強(qiáng)透鏡圖像比強(qiáng)透鏡圖像更加重要。剛開始他們使用簡(jiǎn)單的規(guī)則星系圖像作為非強(qiáng)透鏡訓(xùn)練樣本,發(fā)現(xiàn)結(jié)果正確率非常低。最后把各種可能的非透鏡圖像都考慮進(jìn)來之后,才得到了比較好的結(jié)果。這就像在教電腦認(rèn)識(shí)什么是狗的時(shí)候,還要告訴它貓、羊、牛等等都不是狗。而如果你只告訴它貓不是狗,電腦有非常大的概率把羊和牛認(rèn)成狗。
五、AI可以成為天文學(xué)家有力的臂膀
卷積神經(jīng)網(wǎng)絡(luò)可以充分利用GPU進(jìn)行并行加速,因此,通過裝備更多或更強(qiáng)的GPU,可以極大地提升數(shù)據(jù)的搜索速度和效率,無需懼怕更大數(shù)量級(jí)的天文數(shù)據(jù)。
由于人工智能的幫助,天文研究者得以從數(shù)據(jù)處理和分析的泥沼中解脫出來,將更多的時(shí)間和精力用于思考和探尋宇宙本身的奧秘。
來源:中國(guó)科學(xué)院云南天文臺(tái)