深度學習是人工智能的一種形式,它通過教導計算機使用模仿人腦的人工神經(jīng)網(wǎng)絡來處理信息,從而改變社會。它現(xiàn)在被用于面部識別、自動駕駛汽車,甚至用于玩圍棋等復雜游戲。一般來說,深度學習的成功取決于使用大型標記圖像數(shù)據(jù)集進行訓練。
科學文獻中蘊藏著潛在的標記圖像金礦,每年發(fā)表超過一百萬篇文章。大多數(shù)文本中都融入了許多圖形。迄今為止,這些數(shù)字尚不適合深度學習模型。這在一定程度上是由于其復雜的布局造成的。每個圖形通常包含多個嵌入的圖像、圖表和插圖。還缺乏在文獻中搜索與特定內(nèi)容匹配的圖像的適當方法。
為了應對這一挑戰(zhàn),美國能源部 (DOE) 阿貢國家實驗室和西北大學的研究人員創(chuàng)建了 EXSCLAIM!軟件工具。該名稱代表圖像的提取、分離和基于標題的自然語言注釋。
研究結果發(fā)表在《模式》雜志上。
“電子顯微鏡產(chǎn)生的十億分之一米的圖像是材料科學文獻中最重要的圖像之一,”阿貢納米材料中心(美國能源部科學辦公室用戶設施)的科學家瑪麗亞·陳(Maria Chan)說。 “這些圖像對于理解和開發(fā)許多不同領域的新材料至關重要。我們 EXSCLAIM! 的目標是釋放這些成像數(shù)據(jù)的未開發(fā)潛力。”
什么設置 EXSCLAIM!其獨特之處在于它對數(shù)據(jù)集查詢方法的獨特關注,類似于 ChatGPT 和 DALL-E 等生成式 AI 工具中提示的使用方式。因此,它能夠從圖形中提取具有非常具體內(nèi)容的單個圖像,因為它既可以對圖像內(nèi)容進行分類,又可以識別放大程度。然后它可以為每個圖像創(chuàng)建描述性標簽。這種創(chuàng)新的軟件工具有望成為研究納米級新材料的科學家的寶貴資產(chǎn)。
“雖然現(xiàn)有的方法常常難以解決復合布局問題,但 EXSCLAIM! 采用了一種新方法來克服這個問題,”主要作者、前阿貢國家實驗室研究生 Eric Sc??hwenker 說。 “我們的軟件能夠有效識別清晰的圖像邊界,并且擅長捕捉不規(guī)則的圖像排列。”
標簽:
免責聲明:本文由用戶上傳,與本網(wǎng)站立場無關。財經(jīng)信息僅供讀者參考,并不構成投資建議。投資者據(jù)此操作,風險自擔。 如有侵權請聯(lián)系刪除!