您現在的位置是:首頁 > 舞蹈首頁舞蹈

「深度」定義人性的6個基本評估函式

由 認知維度 發表于 舞蹈2021-07-13
簡介效用分化機制要靠情緒調節系統來輔助完成,基於第3層評估函式,機體體驗了與目標事物的作用趨性,當場景再現時,事物關鍵特徵會激發人的習得行為,但作用體驗可能與原有體驗存在差距,這種差距為情緒觸發創造了條件,通常差異越大,情緒激發越顯著

什麼是屈肌反射

剖析人性,有兩種方法,一種是看錶象,一種是看本質。

表象紛繁,無以窮盡,而人性本質,僅6個函式即可描述!

演算法是智慧系統的靈魂,它很大程度上決定著智慧系統的應用潛能。

理解智慧,首在於理解演算法。AlphaGo擁有兩個巢狀的評估函式,一個優選落子策略,一個反饋盤面勝負,由這兩個網路所建構的演算法經過不斷的訓練,能夠迭代出超人的棋力。雖然評估函式每一次的判斷並不是絕對準確,但是它指明瞭分化的標準和牽引的方向,在不斷試錯中,在不斷的經驗積累中,這種看似不起眼的價值指引最終在更久遠的時空尺度上湧現出了它超出想象力的專業智慧。

對於人類這個獨特的智慧體來說,它的演算法又會是怎樣的呢?人工智慧的突飛猛進與學者對大腦神經網路的研究密切相關,人工智慧的研究成果又反過來成為理解人體智慧的重要參照,結合神經科學、生理學、控制論等眾多交叉學科,實際上已經為我們揭示人體智慧執行機制提供了越來越豐盛的素材。

本文我們將介紹一個可以一定程度上闡釋人體智慧的一套計算框架,它包含有6個逐級巢狀的價值評估函式。這6個函式不對機體本身的既定狀態進行評價,而是對狀態變化的動向進行評價,從而指引機體逐漸適應於各種不確定狀況。

這6個函式也直接定性了人性的本質!

下面一一簡要介紹這6個函式的執行邏輯。

第1層評估函式——宜態分化

首先是第1層評估函式——宜態分化,它與人體內環境的異動密切相關。維納指出:

“高階動物的生命,特別是健康的生命,能夠延續下去的條件是很嚴格的。體溫只要有攝氏半度的變化,一般就是疾病的症候;血液的滲透壓和它的氫離子濃度必須保持在嚴格的限度內;白血球和抵抗感染的化學防疫作用必須保持適當的水平;心博率和血壓必須既不太高也不太低……我們內部組織中必須是一個由恆溫器、氫離子濃度自動控制器、調速器等構成的系統,它相當於一個巨大的化學工廠。[1]”

機體體液迴圈支撐著細胞或分子層面的複雜調節反饋,促使內環境保持在特定的均衡區間內,而遍佈機體的神經系統則不斷採集其中的“異常”訊號,從而引發機體的本能或定向調節反應。第1層評估函式就是定性什麼是“異常”訊號,它並不是對訊號刺激的影響趨性進行標識,而是對刺激訊號的再適應過程進行對比分化,分化的標準就是刺激訊號的前後反差程度。當後續訊號差異較大時,機體會對這一訊號較為敏感,通常會激發明顯的行為調節反應;而當後續訊號差異不大時,機體會逐漸習慣化這種訊號,不會有較為明顯的行為調節反應。不過,如果刺激訊號本身是非適宜的,例如由神經末梢所採集的傷害訊號,那麼機體的適應過程會漫長得多,因為體記憶體在一種分子機制會保持傷害刺激訊號的刺激強度。

「深度」定義人性的6個基本評估函式

從宜態分化的評估機制中可以看到,機體對適宜訊號和非適宜訊號的再適應過程實際上是有細微的差別的,正是這種差別,使得機體更能夠適應於有利的環境,而難於適應不利的環境。

第2層評估函式——焦點分化

感覺系統實現對機體自身狀態異動訊號的採集,而感知系統則實現對機體外部環境狀態異動資訊的採集。以聽覺和視覺為代表的感知系統,在對事物的分類識別過程中,實際上是一個不斷細化特徵關聯性的組合分化系統。以資訊處理頻寬最大的視覺系統為例,眼球平均每天上十萬次的隨機跳動為視覺系統輸入了大量的刺激訊號,視網膜神經元的側抑制機制篩選出了高對比度訊號,而視皮層則進一步篩選出訊號叢集的同步性與否,經過多層處理而獲得了能夠對映表徵事物的典型輪廓特徵。當一種組合特徵相較原有習得的特徵差異性更大時,人的感知焦點會透過上丘腦的反射性眼動而聚焦於特異特徵之上,從而傳入更多刺激訊號,這為牽引機體趨向特徵事物提供了穩定的目的導引引數,也成為建構機體有目的性行為的底層基礎。

「深度」定義人性的6個基本評估函式

在焦點分化的評估機制中,當事物的特徵越特異化時,就越能影響人的既有行為狀態;而當事物的特徵越越一般時,則對人的既有行為狀態影響越有限。這種機制使得個體能夠在處理既定程式時,也能及時對異常狀態給予關注,乃至牽引機體行為趨向。

第3層評估函式——性狀分化

人的行為調節系統實際上是一個多層級的調節系統,其中底層是一個具有自適應性環境的節律運動系統。生理學家將貓的脊髓橫斷後,發現其四肢仍能夠適應履帶並交替抬起和放下[2],這一實驗間接證明了調節系統的多層次性。大疆對四軸飛行器的內環PID引數增加一個負反饋機制後,飛行器的穩定效能得到了極大的提升,這實際上也是一個多層調節機制。多層調節機制的優勢在於,它使得高層的定向調節變得更為簡潔有效:只要稍微調節底層節律運動的傳遞引數的節奏和幅度即可,就像是汽車方向盤和剎車系統對高速迴圈中的動力系統傳導鏈路節點的調控。

第2層講了感知焦點對行為的牽引,基於多級行為調節機制,使得焦點牽引行為的機制實現更簡潔、更穩健。而當行為實施時,機體就會產生與焦點事物的作用互動,同時觸發感覺系統的訊號傳入,在作用過程中,事物的區域性特異焦點會進一步牽引機體與事物做進一步的互動,從而引發機體更全面的採集事物的作用反饋。作用過程中的體驗可能是積極的,也可能是消極的,消極通常會引起屈肌反射,導致作用過程中斷。

「深度」定義人性的6個基本評估函式

對於性狀分化的評估機制來說,它比前兩個評估機制所能分化的資訊維度更高,它實際上相當於是對宜態分化機制和焦點分化機制的綜合。主要體現在兩個方面,一是檢驗訊號同步性,那些感覺刺激訊號和感知特徵訊號的同步激發,才能形成個體對作用物件的作用認知,而那些不同步激發的訊號,則不會被機體記憶系統所刻錄下來;二是關聯訊號體驗趨性,特定作用方式和作用目標因為與感覺的同步,而間接獲得了一種價值趨性標籤,它的意義在於,個體將對內環境的價值評價同步遷移到了外部事物以及特定的作用邏輯之上。

第4層評估函式——效用分化

前面3層評估函式實際上定義了一個具有一定自適應能力的運動系統的基本行為規則,不過它離人性還相距甚遠,它只會記錄體驗卻不會調教有價值行為。假如讓這套系統去玩紙飛機,因用力擺動飛機而意外帶來的空中飛舞這一新奇表現,會引發有效視野的快速集中,進而強化特徵事物與系統行為之間的關聯,於是系統學會了扔飛機。然而,如果接下來的動作不到位,獲得了像扔其他東西一樣的常規落地表現,那麼該系統還會繼續扔飛機嗎?很大機率不會。

如果換做小孩來扔飛機,通常會進行多次嘗試,以更好的飛行姿態為目標,直到玩膩為止,形成這種有目的定向行為取向的關鍵原因在於人的第4個評估函式——效用分化機制。

「深度」定義人性的6個基本評估函式

效用分化機制要靠情緒調節系統來輔助完成,基於第3層評估函式,機體體驗了與目標事物的作用趨性,當場景再現時,事物關鍵特徵會激發人的習得行為,但作用體驗可能與原有體驗存在差距,這種差距為情緒觸發創造了條件,通常差異越大,情緒激發越顯著。情緒反饋會有明顯的兩種趨性表現,一種是積極快樂的,一種是消極痛苦的。體驗積極的行為通常會受到鞏固,而體驗消極的行為則會受到抑制,這種鞏固和抑制與情緒所分泌的大量激素對腦皮層網路的影響有關。於是,在情緒機制調教下,人從原有的隨機牽引行為開始轉向於有特定價值

趨向

的定向行為。

在效用分化機制當中,情緒對價值運算並不是十分精確的,但卻快速直接,雖然單次的評價存在誤差,但多次體驗後,個體就能夠獲得越來越成熟的認知,類似場景體驗就愈難以激發情緒。情緒機制對存在差異化的行為認知體驗高度敏感。

第5層評估函式——義利分化

對於效用分化機制來說,只要有差異化的體驗,人就會自然的趨向於有更好效用體驗的場景中,這就展現了人的一種本能——需求無止境。然而,環境條件的限制使得這種無止境的渴求不可避免的受到鉗制。當資源稀缺時,一方對資源的對接意味著另一方對資源的脫節,這種現象對另一方來說就是一種消極反應,效用分化機制會指引另一方抑制這種脫節行為而獎勵再次對接行為,於是兩方的行為在對接稀缺資源上面發生了矛盾衝突。

在解決矛盾的過程中,雙方的行為都會給對方造成影響,直到其中一方因遭受某種苦痛刺激而觸發本能的規避反應,此時雙方的衝突才有可能初步終結,而矛盾互動雙方也因為衝突的處理而獲得了對特定場景條件下資源可達程度的認知,這一認知正是權屬的體現。個人行為能力的成長變化,也會導致掌控衝突的實際表現不同。

「深度」定義人性的6個基本評估函式

上述分化人與人之間矛盾的過程即義利分化,這一機制同樣需要情緒的反饋調節。當自身的行為反應太過分時,會滋生愧疚情緒;當自身的行為反應不夠的時候,會滋生憎恨情緒……這種情緒反饋會使得雙方的衝突趨向於一種制衡博弈下的脅從。除了稀缺資源引發的衝突,還有非資源衝突下的幫扶互助,此時情緒反饋機制一樣會對雙方的互助水平進行調節:如果幫扶過度,會心生傲慢,如果幫扶不到,會過意不去……此時情緒反饋也會促使雙方達成一種協同狀態。一般來說,對方影響和自身反應之間的效用差越巨大,情緒反饋越強烈,這種負反饋實際上間接導致了雙方與特定場景資源間趨向一種拮抗均衡,當環境條件發生變化時,這種均衡隨時都有可能被打破。

第6層評估函式——趨勢分化

基於前面5種評估函式,已經可以初步的模擬人的各種基本行為表現。雖然條件引數與行為反應之間通常有較為直接的對映關聯,但據此實際上並不能確切地預測人的各種行為趨向和價值認知,這是因為人還有第6層評估函式,即趨勢分化機制。

在5個基本評估函式的分化下,個人積累了越來越多的關係體驗,這就容易導致在特定的場景下,個人同時觸發了兩個趨性對立的行為趨向。例如某學生非常喜歡吃甜品,但又瞭解到吃甜品容易導致肥胖,這種狀態中,前者牽引行為趨向,後者抑制行為趨向,於是兩種作用方式形成拮抗,使該學生無所適從,此時需要藉助於趨勢分化機制來完成矛盾運算。如果說第5層評估函式分化的是自身和外部的矛盾的話,那麼第6層評估函式分化的就是自身與自身的矛盾。

「深度」定義人性的6個基本評估函式

趨勢分化機制依然涉及到情緒的反饋調節。當存在對立性行為趨向時,會引發個人的焦慮情緒,透過認知回溯來尋找特定的關係背景進而分化出價值差異,來牽引個人行為趨向,這個過程就是一個決策過程。當決策實施後,會形成實際的作用體驗,當這種體驗與初始的認知(即決策時的價值預期)之間存在差異時,就會激發進一步的情緒反饋(成就或後悔),這種反應會反向調節當初的行為決策趨向,從而使得個人最終習得在特定矛盾場景中的恰當行為選擇。

趨勢分化機制分化的基礎是前面5個價值評估函式所沉澱的關係認知,當對這些認知做進一步的價值分化時,實際上會重構過往的部分關係認知,這對於底層分化機制所引發的各種“短視魯莽”行為會起到有效的再調節作用,從而引導個人不斷趨向成熟。

模型總結

6個評估函式對應著6套訊號處理機制,並且這6個機制是逐級巢狀擴張的,越低層訊號處理邏輯越簡單,越高層資訊處理程式越複雜。從功能表現上來看,前3層定義了一個自適應智慧體的基本行為模式,這是一個“不知天高地厚”的智慧體,它在差異化感知特徵的驅使下不斷實踐各種環境狀態,並從中記錄體驗的優劣;後3層因情緒的調校而逐漸閃現出了人性的複雜,其中效用分化機制類似於貪心演算法,義利分化類似於MinMax演算法,趨勢分化類似於強化學習演算法。

如果把上述6個評估函式進行整合的話,可以得到下面的模型圖(即雪花模型)。遺傳演算法之父約翰·霍蘭指出了建構普適理論所應具備的4個基本架構:狀態、對策樹、規則、主體。雪花模型正是按這個架構搭建的,其中狀態對應關係層,對策樹對應作用層,規則對應價值分化機制(即評估函式),主體對應意識層。整套體系相當於用物化的方式來還原具有智慧靈性的智慧生命體的內在本質結構,它暗示了重構類人智慧體的一種基本建構框架。

「深度」定義人性的6個基本評估函式

要注意的是,僅基於這6個評估函式並不能完全描述人的各種行為和心理表現,其中還有一個重要的環節,那就是遷移學習機制,它使得個人不僅能夠處理已經體驗過的場景,也能夠處理沒有體驗過的場景。每一個層次的評估函式的遷移學習模式基本類似,即特徵要素的區域性關聯替代。評估函式只是提供了基本的規則,只有基於這套規則不斷學習,不斷充實腦皮層的神經元網路連線,才能催生出一個成熟的智慧生命體。

以上介紹相對粗糙,欲獲知更為詳細的推演過程,可參考拙作《認知的維度》進一步瞭解詳情。

2018年9月 宋鋒林

[1] 維納著《控制論》,郝季仁譯,二版,科學出版社,2009年,89頁。

[2] John G, Nicholls, A。Rober Martin, Paul A。 Fuchs, David A。 Brown, Mathew E。Diamoud, David A。 Weisblat著《神經生物學》,楊雄裡等譯,第五版,科學出版社,2014年,第583、588頁。