您現在的位置是:首頁 > 綜藝首頁綜藝

國際最大多模態同步語言神經影像資料集釋出

由 北京日報客戶端 發表于 綜藝2023-02-01
簡介構建高時空解析度的神經影像資料,能幫助我們更好地瞭解各個腦區以及腦區之間的協同合作,對於研究大腦的語言加工機制至關重要

mooda同步資料是什麼意思

北京日報客戶端 | 記者 劉蘇雅

中國科學院自動化研究所自然語言處理研究組正式釋出了目前國際上規模最大、包含資訊最豐富的漢語同步多模態神經影像資料集。其覆蓋了近萬個漢語詞彙,將為全方位研究大腦在真實場景下理解詞彙、短語和句子時如何調動不同腦區,以及不同腦區之間如何協同工作等科學問題提供重要支撐。相關論文發表於《自然》雜誌子刊《科學資料》(Scientific Data)。

國際最大多模態同步語言神經影像資料集釋出

大腦在加工語言時,需要實時調動多個腦區的神經元進行協同工作。構建高時空解析度的神經影像資料,能幫助我們更好地瞭解各個腦區以及腦區之間的協同合作,對於研究大腦的語言加工機制至關重要。但當前已有的開源資料主要針對英文采集,只包括單一模態的神經影像資料,且資料規模有限,無法探索更全面、更深入的大腦語言加工機制。

為突破上述問題,研究團隊請12名被試者收聽時長約6小時的故事,收集、採集、整理他們的功能核磁共振、腦磁圖、擴散磁共振成像和靜息態核磁共振等資料。同時為便於利用計算模型進行腦語言處理機制的研究,所有故事材料都由人工標註了句法結構樹,計算了文字中每個詞彙對應的音訊時間點、詞頻等。從而形成了當前國際上最大規模用於腦語言處理機制研究的多模態同步神經影像資料集,所有測試指標均超越或可比於已有的同類資料集。

我們的大腦究竟怎樣調動各腦區去理解語言?不同腦區之間如何協同工作?關於這些問題,該資料集都能提供研究支撐。其將在探索自然語言計算模型與人腦語言處理機制的關係,以及利用神經影像資料提升現有語言計算模型的效能,從而構建新一代受腦啟發的神經語言模型等工作中發揮重要作用。