人工智能助力天文觀(guān)測分析海量數據已十分普遍
來(lái)源:科技日報 編輯:QQ123 2021-04-23 08:55:26 加入收藏 咨詢(xún)

所在單位: | * |
姓名: | * |
手機: | * |
職位: | |
郵箱: | * |
其他聯(lián)系方式: | |
咨詢(xún)內容: | |
驗證碼: |
|
研究人員利用人工智能的深度學(xué)習方法,發(fā)現了38個(gè)新的強引力透鏡候選體,為研究天體物理學(xué)問(wèn)題提供了新的“宇宙探針”候選體。
近年來(lái),隨著(zhù)技術(shù)日益進(jìn)步,天文學(xué)研究中產(chǎn)生了海量數據。天文學(xué)家要想從郭守敬望遠鏡、“中國天眼”FAST、LSST大型綜合巡天望遠鏡等遍布世界的大型望遠鏡捕獲的海量數據中找出有價(jià)值的信息以資研究,無(wú)異于大海撈針。
如何高效地處理這些數據,已成為現代天文學(xué)面臨的一項重要挑戰。由于人工智能在海量數據分析和處理方面所具有的突出優(yōu)勢,它也很自然地走入了天文學(xué)家的視野。
日前,中國科學(xué)院云南天文臺麗江天文觀(guān)測站龍潛研究員與云南大學(xué)中國西南天文研究所宇宙學(xué)研究組爾欣中教授團隊合作,利用人工智能深度學(xué)習的方法,發(fā)現了38個(gè)新的強引力透鏡候選體,為研究天體物理學(xué)問(wèn)題提供了新的可靠的“宇宙探針”候選體。英國《皇家天文學(xué)會(huì )月刊》發(fā)表了這項研究成果。

助力之一:天文觀(guān)測產(chǎn)生海量數據 用機器學(xué)習給天體分類(lèi)已十分普遍
隨著(zhù)下一代大規模測光巡天項目的開(kāi)展,人們期待發(fā)現數以萬(wàn)計的強引力透鏡系統。但如何在海量天體圖像中快速地找到強引力透鏡候選體?近年來(lái),人工智能的快速發(fā)展,給人類(lèi)提供了一種新的可能。
以2009年發(fā)射升空的世界首個(gè)用于探測太陽(yáng)系外類(lèi)地行星的飛行器開(kāi)普勒太空望遠鏡為例,僅在起初3年半的任務(wù)期內,就監控了超過(guò)15萬(wàn)個(gè)恒星系統,同時(shí)也產(chǎn)生了海量數據。這些數據通常要經(jīng)由計算機處理,但當計算機識別出一定的信號時(shí),又必須依靠人類(lèi)分析,判斷其是否是行星軌道所產(chǎn)生的,這項巨大的篩查工作單靠美國國家航空航天局(NASA)的科學(xué)家或科學(xué)小組,是無(wú)法有效完成的。
“如此大的數據量,人工分析在很多時(shí)候已經(jīng)達不到所需要的速度。借助人工智能的優(yōu)勢,我們可以極大地提升對數據的分析速率。”龍潛向科技日報記者介紹,人工智能展現出來(lái)的效率和準確性遠高于傳統方法。
龍潛研究員長(cháng)期從事人工智能深度學(xué)習方面的研究。近期,他與爾欣中教授團隊合作,構建并訓練了一個(gè)卷積神經(jīng)網(wǎng)絡(luò ),用來(lái)尋找強引力透鏡系統。他們把這個(gè)網(wǎng)絡(luò )應用到歐洲南方天文臺2.6米巡天望遠鏡(VST)千平方度巡天數據,并找到了38個(gè)新的強引力透鏡候選體。此次構建的神經(jīng)網(wǎng)絡(luò ),也可應用于其他大型望遠鏡的巡天數據。
“在這項工作中,我們用計算機分別模擬了強引力透鏡圖像和非強引力透鏡圖像,從而來(lái)訓練計算機。我們發(fā)現,在準備訓練計算機的圖像時(shí),非強引力透鏡圖像比強引力透鏡更加重要。”爾欣中說(shuō),開(kāi)始的分析中,他們使用簡(jiǎn)單的規則星系圖像作為非強引力透鏡訓練樣本,發(fā)現結果正確率非常低。只有把各種可能的非引力透鏡圖像都考慮進(jìn)來(lái)之后,才能得到比較好的結果。
“這就像在教電腦認識什么是狗的時(shí)候,還要告訴它貓、羊、牛等都不是狗。而如果你只告訴它貓不是狗,電腦有非常大的概率把羊、牛認成狗。”龍潛說(shuō),目前利用機器學(xué)習來(lái)對天文學(xué)中各種天體分類(lèi)已經(jīng)非常普遍,最簡(jiǎn)單的是把恒星和星系分開(kāi),或者把不同行態(tài)的星系進(jìn)行分類(lèi),以及利用星系的多重顏色來(lái)估計星系的距離等。

助力之二:每秒可識別上萬(wàn)張照片 新型神經(jīng)網(wǎng)絡(luò )便于實(shí)時(shí)修改、訓練和測試
人眼看強引力透鏡系統的圖像,最快就是每秒鐘看一張圖。而計算機每秒鐘可以識別成千上萬(wàn)張圖片。
龍潛研究員和爾欣中教授團隊此番訓練的這個(gè)卷積神經(jīng)網(wǎng)絡(luò ),可以充分利用GPU進(jìn)行并行加速,通過(guò)裝備更多或更強的GPU,系統可以根據實(shí)際需要極大提升搜索速度和效率。
“這個(gè)神經(jīng)網(wǎng)絡(luò )的訓練,主要使用模擬數據,只使用了很少的人工標注數據,由于模擬數據可以任意生成,因此多樣性遠大于人工標注數據,進(jìn)一步根據數據的特點(diǎn)調節訓練參數和訓練算法,使神經(jīng)網(wǎng)絡(luò )的泛化能力得到了極大的提高。”龍潛說(shuō),此外,研究人員使用新型科學(xué)計算語(yǔ)言Julia完全自定義網(wǎng)絡(luò )結構,由于Julia語(yǔ)言兼具速度和靈活性,使得神經(jīng)網(wǎng)絡(luò )在CPU和GPU上都有良好的性能,并且可以任意切換,因此非常有利于研究人員實(shí)時(shí)修改、訓練和測試。
“我們還通過(guò)對引力透鏡數據的研究,定制了有針對性的小型網(wǎng)絡(luò ),有效地抑制了過(guò)擬合現象,同時(shí)實(shí)驗證明該網(wǎng)絡(luò )具有與大型網(wǎng)絡(luò )相似的準確率。相比大型網(wǎng)絡(luò ),小型網(wǎng)絡(luò )在普通計算機終端就可以訓練和測試,不需要依賴(lài)大型GPU集群,這為天文工作者使用和改進(jìn)網(wǎng)絡(luò )提供了便利。”龍潛說(shuō)。

目前,隨著(zhù)技術(shù)與裝備水平快速發(fā)展,人工智能在天文學(xué)上的應用還會(huì )越來(lái)越多。“我們計劃對一些變源的多波段光變曲線(xiàn)來(lái)進(jìn)行機器的快速分類(lèi),這樣在實(shí)施大樣本巡天的時(shí)候,電腦可以自動(dòng)對所發(fā)現的變源進(jìn)行篩選,并對我們感興趣的天體做出提示,以便進(jìn)一步開(kāi)展后續研究工作。”爾欣中說(shuō),正因為人工智能的幫助,天文研究者得以從耗時(shí)單調的數據篩查分析中解脫出來(lái),當人力“大海撈針”難以招架之日,正是人工智能大顯身手之時(shí)。
評論comment