您現在的位置是:首頁 > 綜藝首頁綜藝

Cerebral Cortex:男女性別差異的大腦形態學標記物

由 悅影科技 發表于 綜藝2022-12-06
簡介本文對青少年大腦認知發展(ABCD)樣本中的結構像(T1)得到的形態測量特徵,使用支援向量機分類器(SVC)來測試其分類效力

比較性別差異用什麼統計方法

1.摘要

許多神經精神疾病(一些出現在青春期)在患病率、發病率和症狀上存在性別差異。因此,探究男女發育期間大腦結構的差異,有利於探究關於這些疾病二型性背後的神經機制。利用Adolescent Brain Cognitive Development研究收集的資料,使用線性支援向量機分類器,根據結構腦成像資料的形態計量學和影象強度值來預測性別,探究青少年(9-10歲)男性和女性大腦(n=8325)的差異。分類器對86%的個體進行了正確的性別分類,其中腦島、中央前回和中央後回以及胼胝體周圍溝是最明顯的特徵。這些結果表明存在複雜但強有力的測量大腦性別差異的形態標誌。

2.引言

許多神經精神疾病在患病率、發展軌跡和症狀上存在性別差異。如,有研究表明自閉症譜系障礙(ASD)在男性中的患病率明顯高於女性。重度抑鬱症(MDD)存在相反的模式,女性患病率高於男性。在青春期就觀察到,抑鬱症患者可能存在性別差異。因此,研究大腦中的性別差異是非常重要的。確定在青春期是否存在生物性別的大腦標誌物對理解男女大腦發育差異起重要作用。建立這樣一種大腦二型性模式將為我們指出不同特徵的可能來源,並促進對這些二型性大腦結構功能的進一步理解。

單變數分析已經證明了整體形態差異,如男性和女性的顱內體積(在灰質質量區域性差異的大小和方向上存在不同),有研究認為大腦中絕大多數“馬賽克”在兩性之間基本上是重疊的,大腦中的區域性差異很小。然而,有研究表明男性和女性確實具有不同的大腦特徵,使用結構腦成像得到的分類準確率超過90%。大量實驗在關鍵發育期(如青春期)的特定時間點對大腦二型性進行研究,探究生物性別中大腦二型性的特定年齡問題。

本文對青少年大腦認知發展(ABCD)樣本中的結構像(T1)得到的形態測量特徵,使用支援向量機分類器(SVC)來測試其分類效力

。使用大腦形態測量和影象強度測量作為生物性別的預測特徵。如果SVC能夠利用這些特徵成功對生物性別進行明顯高於偶然性的分類,就證明大腦中存在二型性,並在發育期存在可測量的大腦性別標記物。此外,透過兒童行為檢查表(CBCL)綜合徵量表和《精神障礙診斷與統計手冊》第5版(DSM5)為導向的量表,探究大腦形態計量對兩性臨床症狀學的潛在影響。

3.材料與方法

3.1樣本的人口統計資料

從ABCD資料集中獲得11533名受試者的結構MRI資料。排除標準如下:(1)T1掃描沒有透過原始資料質量控制的受試者;(2)沒有透過FreeSurfer質量控制的受試者;(3)缺失T1相關形態計量或強度特徵資料的受試者;(4)缺失認知和臨床測量資料的受試者。最終樣本包括8325名參與者(mean SD age=119。07 7。48months),其中包括4308名男性(年齡= 119。157。46months)和4017名女性(年齡= 118。997。50months)。男性和女性的年齡(對大腦形態計量學存在影響)不存在顯著性差異,t(8325)=0。95,p =0。34,貝葉斯因子值為0。04。

3.2樣本的MRI資料

ABCD研究提供了結構像的形態測量和影象強度值,這些值作為本研究的預測特徵。使用FreeSurfer的自動處理流程對皮質表面進行重建,從T1像建立形態測量和影象強度測量。皮質灰質和底層白質體素的標籤根據基於表面的非線性配準到Destrieux圖譜,基於該圖譜提取ROI。形態測量包括四類:皮質厚度、皮質表面積、皮質體積和溝深度。雖然這些測量是相關的,但在灰質完整性上存在差異,且有些(表面積/厚度)具有遺傳獨立性。影象強度測量包括三類:平均灰質強度、平均白質強度和沿灰白邊界的平均對比度:GWC=(白-灰)/(白+灰)。GWC是組織完整性和髓鞘降解區域性變化的敏感指標,這可能反映了一種獨特的生物訊號,該訊號隨年齡不斷變化,並且較皮質厚度增加了臨床敏感性。對148個ROI提取每一個特徵(每個半球74個ROI)。將左半球所有ROI的平均值、右半球所有ROI的平均值以及所有ROI的平均值也作為預測特徵。

3.3支援向量機分類

SVC是一種分類演算法,試圖在預測特徵的超空間中找到一個最佳分離二元類(男性和女性)的超平面。將上述提到的四類形態測量和三類影象強度值作為該樣本性別分類的預測特徵。對所有受試者的1057個特徵進行標準化,並將其透過scikit-learn機器學習庫輸入到線性SVC,來預測個體性別(引數C=0。01)。目標變數性別編碼為女性“1”,男性“0”。分類決策是透過權重和輸入資料的線性組合進行計算: = Tx+b。如果結果為正,則預測結果為女性;為負,則預測為男性。採用交叉驗證的10000次迭代模擬方法評估SVC的效能。即在每一次迭代上,分類器在資料的隨機子集(80%)上進行訓練,並在剩餘子集(20%)上進行測試。

為驗證上述線性SVC方法,還進行了另外兩項分析。首先,將線性SVC效能與深度學習進行比較,來驗證是否可以透過非線性機器學習來提高分類效能。所有特徵均包括在內。對TensorFlow 2建立的全連線的密集網路(two hidden layers,eachsize=128,Reluactivation,output size=2,softmax activation;loss=sparse categorical cross-entropy,optimizedwith Adam,batch normalized)進行訓練和測試(80%訓練,20%測試)。其次,由於該樣本招募了表現出內化和外化症狀的兒童,可能會影響分類效果。為了確保分類不會因內化和外化嚴重程度的差異而產生偏差,使用線性SVC程式對原始資料集的三個三元組進行測試:將報告的內化和外化行為分為低、中、高三個水平(內化+外化原始分數;低:0–3,中:3–10,高:10–83)。最後,對七個輸入特徵集中的每一個特徵集使用上述SVC程式,來評估這些不同特徵型別對個體的重要性和貢獻。

3.4確定重要貢獻的特徵

線性SVC的一個優點是非零特徵權重可能有助於成功分類。使用置換法進行模擬,來評估所觀測到的特徵權重對成功分類的重要性:將第一次模擬得到的平均觀測特徵權重(對10000次迭代結果取平均值)與特徵權重的零分佈進行比較。使用SVC程式得到這些特徵權重的零分佈,在10000次迭代的第二次模擬中使用分類標籤(性別)的隨機分配。此模擬得到每個特徵的權重分佈近似正態(mean Shapiro-Wilkstatictic:0。9998);因此,這些樣本可定義每個特徵的正態分佈,與觀測到的權重進行比較並確定顯著性。每個特徵在95%置信區間外的平均觀測權重(Bonferroni校正:n = 1057;mean4。069SD)是成功分類的重要因素。

3.5臨床措施及探索性分析

ASEBA是ABCD資料庫中的精神健康評估系統之一,包括CBCL量表和DSM-5量表。利用線性SVC探究腦特徵,本文進行了一項探索性研究來評估這些二型腦區域在調節性別與臨床症狀間關係中的作用。

4.結果

4.1SVC效能

表1顯示了對所有特徵和每個特徵集的分類效能。對所有樣本(所有輸入特徵)的分類正確率為86。3±0。8%(mean),包括七個特徵集:皮質厚度、腦溝深度、皮質面積、皮質體積、T1灰質強度、T1白質強度和T1 GWC。與線性SVC相比,深度學習並未提高分類效能:訓練準確率為100%,測試準確率約為85%。因此,未對這一性別分類模型進行進一步研究。所有特徵的分類準確率按照內化和外化行為的嚴重程度劃分後,其結果大多保持不變,並且使用線性SVC對三個組測試得到分類準確率相似(低= 82。9±1。4%,中= 83。3±1。4%,高= 82。4±1。5%)。因此,對有助於分類的特徵的測試是基於全樣本,而不是分層樣本。七個特徵集的所有預測都顯著高於偶然水平,準確率範圍為69。4%(白質強度)至76。0%(皮質面積)。

Cerebral Cortex:男女性別差異的大腦形態學標記物

4.2具有顯著分類效果的特徵

識別出具有顯著正權重的四個特徵( >0,類別1,女性特徵,紅色區域)和具有顯著負權重的九個特徵( <0,類別0,男性特徵,藍色區域),並透過fsbrain視覺化軟體包進行視覺化(圖1)。

Cerebral Cortex:男女性別差異的大腦形態學標記物

圖 1 視覺化所有具有顯著權重的大腦區域的視覺化。L:左半球,R:右半球。紅色:正權重(女性特徵),藍色:負權重(男性特徵)。

權重為正的區域包括右側中央後回(皮質厚度)、左側長島回和島葉中央溝(皮質體積)、島葉環形溝左前段(皮質體積)和顳極(GWC)。權重為負的區域包括左側枕上回(皮質厚度)、右側舌回(溝深度)、外側溝左後支(皮質區)、左側中央前回(皮質體積)、右側胼胝體周圍溝(灰質密度和白質密度)、島環溝左上段(GWC)、右側枕顳外側回(GWC)和島環溝右上段(GWC)。表2展示了這些特徵的標籤和權重。

Cerebral Cortex:男女性別差異的大腦形態學標記物

Cerebral Cortex:男女性別差異的大腦形態學標記物

圖 2 13 個特徵的描述性統計(均值和標準誤差)。L:左半球。R:右半球。WM:白質強度。GM:灰質強度。

圖2展示了這13個特徵的描述性統計(平均特徵權重和標準誤差),以表明機器學習多元方法和單變數統計間的敏感性差異。雖然這13個特徵能成功分類,但其多變數特徵並不是單變數特徵的混合;這些特徵中的大多數在很大程度上是重疊的或處於其他方向上(如,左側長島回&島葉中央溝,島葉環形溝的左前段)。

SVC 是一種多元模式分析方法,因此對特徵間的非線性依賴性很敏感;因此,能夠捕捉到大腦內更復雜的二型性模式。在使用這13個特徵作為生物性別預測因子的線性SVC模型中,得到這些特徵的平均分類準確率為70。8 ± 1。0%。特徵型別中的任一半球(或兩個半球一起)的平均特徵值不能作為顯著特徵。

4.3調節性別與臨床症狀關係的二型特徵

對13個二型區域(作為性別和臨床症狀間關係的調節因子)進行了平行測試。其中三個區域(島環溝上段、外側溝左後支和左中央前回)被認為是各種臨床症狀的調節因子。但是,多重校正後,並未觀察到臨床症狀的顯著調節因子。

5.討論

使用形態測量和影象強度值作為預測因子,能夠對大樣本的男性和女性(9-10歲)進行性別分類,準確率約為86%。還確定了13個顯著特徵,成功對男性和女性進行分類。本文研究不僅描繪了生物性別的大腦標記物,還有助於概述男性和女性在發育期的獨特軌跡。

ABCD 資料集一個明顯的優勢是樣本量大。在8000 多個樣本中,本文的分析方法可以很好地揭示大腦差異。另外,從 FreeSurfer 處理後得到的輸入特徵有兩個優勢。首先,這些大腦測量可以表示大腦形態測量的特徵,可以從單一掃描型別(如 T1 影象)得到多種生物變數。任何單一特徵型別只能達到 76。01% 的分類準確率,而所有特徵型別集合的預測能力更強。其次,特徵多樣性導致資料高維性,可以更好的進行線性可分,同時也不會因足夠多的觀測特徵而受限於“維度詛咒”。Destrieux圖譜也有利於降維。資料結構很重要:透過線性分離資料的可能性,本文使用的模型較其他非線性方法更具解釋性,同時可以使用高維SVC檢測基於這些特徵分類的非線性依賴性。實際上,本文所用的SVC方法的效能相當於一個引數化模型。SVC方法可以很好的檢測二型性,同時較更傳統的統計學方法具有同等的解釋性。

可透過同時觀察特徵權重和特徵均值來理解SVC較單變數方法的優勢。正或負權重不一定具有類似的均值差異;因此,使用單變數方法進行分析無法檢測這種差異。單變數方法試圖確定組間足夠大的均值差異,使用以假陽性率為條件的零假設顯著性檢驗方法進行評估(通常α設定為0。05)。而SVC透過學習一個決策邊界,可以最好地將資料分成兩個給定的類。本文認為“大腦馬賽克”是一個複雜但可測量的非線性特徵組合。

有趣的是,半球(或兩個半球一起)的平均特徵值不能作為顯著特徵。不清楚是由於該資料集的年齡範圍受限,還是區域性特徵對分類更重要。區域性特徵可用於區分男性和女性,僅使用13個區域性腦特徵,準確率達76%。

性別二型性和行為二型性間的關係很複雜,目前尚不清楚。有研究表明,幾個二型的皮質區域與邊緣系統有直接關係,包括顳極、左側島葉和左側外側溝的多個溝、右側島葉的圓形溝、左側中央前溝、右側後中央溝和右側胼胝體周圍溝。

在本文分析中得到島葉周圍的幾個區域為二型。GWC反映了大腦皮層和下表白質的不同髓鞘分化,島葉、扣帶回和中央前/中央後皮質記憶體在的GWC個體差異與青少年的心理健康和一般認知功能有關。圓形溝勾勒出島葉的周長,將其與顳葉、額葉和頂葉分開。有研究表明島葉可能是情感功能障礙和情緒障礙的根源。

本文觀察到在顳極中的GWC的二型性。顳極是顳葉最前部的一個邊緣旁區域,和精神分裂症和精神病中的島葉有關。同時還觀察到初級感覺區(如枕上回、舌回和中央後回)存在二型性。用於言語的運動區也表現出二型性,本文分析的左側中央前回也具有二型性。

雖然僅13個區域就表現出良好的預測準確性,說明二型分佈具有穩健性,但還需要更詳細的研究來探究本研究得到的二型性是否對感知加工和更復雜的行為有影響。事實上,僅僅因為所確定的區域與二型性行為具有相同的功能作用,就將大腦二型性(尤其是這種二型特徵中的單一特徵)認為是行為二型性的因果關係,這是不正確的。對本文分析中的區域進行針對性研究,來探究大腦二型性是否在行為二型性或臨床表型的行為特徵中具有功能作用是很重要的。雖然在多重比較校正後,並沒有得到調節性別和臨床症狀間的顯著特徵,但未來可以進行研究來確定性別、大腦二型性和臨床症狀之間的關係。