您現在的位置是:首頁 > 綜藝首頁綜藝

演講直擊|凱文·阿什利:法律文字分析與解釋的困境

由 澎湃新聞客戶端 發表于 綜藝2023-01-04
簡介然而,即使這些學習來的特徵可以從神經網路中提取出來,也並不必然與法律執業者能夠理解的法律知識相對應,因此,他們所使用的機器學習路徑並不能解釋其預測的結果,這一路徑能做的只是突出顯示那些能夠影響預測結果的文字,為此它採用了多層注意力網路(HA

演講屬於什麼文字型別

原創 凱文·阿什利 上海市法學會 東方法學 收錄於合集#2022世界人工智慧大會法治論壇 69 個 #法治論壇 86 個

法律文字分析與解釋的困境

法律文字分析,或稱為文字挖掘,是人工智慧與法律領域的一個分支,透過採用自然語言處理和機器學習,從案件裁判、合同或制定法中自動提取有意義的語義資訊。法律文字分析深度學習裝載有大型文字資料庫的神經網路。神經網路由輸入/輸出節點組成,這些節點透過邊緣加權與多層中間節點相連。輸入透過網路上的節點傳遞至輸出。這個過程包含對邊緣權重的線性組合。其目的是學習那些能夠使計算機輸出與目標輸出之間差異最小的權重。

不同的網路架構、層數和深度適合於不同的分析目標。深度學習和神經網路應採用多層架構,隱蔽層可以幫助學習具有預測性權重的各種特徵。這就存在解釋上的問題。神經網路透過學習權重可以進行預測,但還不能產生我們可以理解的解釋。比如說,這些“知識”散佈於神經網路的權重中,很難將這些知識從神經網路中提取出來,並以此對這些預測進行解釋。此外,這些權重並不必然能夠對應於法律執業者認為相關的“知識”。事實上,能夠用以解釋的相關“知識”甚至不存在於神經網路之中。研究人員Ilias Chalkidis和他的團隊應用深度學習演算法,直接從案件事實的文字描述中預測案件結果。他們的演算法可以預測歐洲人權法院是否能夠認定相關事實是否違反《歐洲人權公約》,以及違反了公約的哪些條款。研究人員收集了近85,000個案例用以演算法的資料裝載和開發,並使用3,000個案例用於測試。他們採用了基於BERT語言模型的演算法結構,在F1分數上表現極佳(F1分數是精確率和召回率的調和均值),用這一演算法對是否違反公約進行預測,得到的F1分數為0。82(F1分數的滿分為1。0)。而該演算法對違反哪些條款的預測,得到的F1分數為0。6。這一結果令人印象深刻,特別是他們的機器學習模型並不使用那些能夠反映法律“知識”或實體法律問題的特徵。

無需法律規則,無需案例,也無需法律價值判斷。

可能有人會問,誰需要這種演算法?

從案件文字中的深度學習,可以自動學習那些在確定預測中佔有權重的特徵。然而,即使這些學習來的特徵可以從神經網路中提取出來,也並不必然與法律執業者能夠理解的法律知識相對應,因此,他們所使用的機器學習路徑並不能解釋其預測的結果,這一路徑能做的只是突出顯示那些能夠影響預測結果的文字,為此它採用了多層注意力網路(HAN)。

如前所述,不同的網路架構、層數和深度適合於不同的分析目標。多層注意力網路能夠預測案件結果,並且產生神經網路的注意權重。多層注意網路中的注意力權重可以突出顯示檔案中的相關部分,或者至少突出顯示最具預測力權重的部分。這使得使用多層注意力網路的突出顯示來解釋預測結果成為可能。

Chalkidis和他的團隊想利用多層注意力網路從神經網路中找出法律解釋的成分。對於那些對模型結果預測有更大影響力的文字部分,多層注意力網路將賦予更高的注意力分數,然後在介面中突出顯示這些文字,並且希望這些突出顯示的部分能夠等同於對預測結果的解釋。Chalkidis在生成突出顯示的事實描述時,使用了多層注意力網路。

《歐洲人權公約》第3條禁止酷刑,以及不人道或有辱人格的待遇或懲罰。事實上,如果人們仔細去閱讀那些突出顯示的部分,就可以發現這些突出顯示的內容確實有一定的意義,但還是會質疑這些內容能否等同於解釋。

卡爾·布蘭廷的實驗表明,這些突出顯示的、具有高注意力分數的文字對法律結論的解釋意義有限。他的團隊讓61位專家和非專家人士參與一項任務,該項任務主要對世界智慧財產權組織(WIPO)規則下的網路域名爭端解決的裁判進行分析。世界智慧財產權組織仲裁與調解中心提供無需在法庭進行訴訟,而解決網路域名爭端的規則和機制。在實驗中,參與者都被賦予了一項任務。每個參與者都被要求對兩組獨立案件中的“無權利或合法利益(NRLI)”問題進行裁判,併為每項預測提供理由。無權利或合法利益是世界智慧財產權組織域名爭端解決中的重要問題。四個實驗條件中,有兩個涉及基於注意力權重而突出顯示部分案件文字。實驗結果表明,突出顯示並不會對預測的正確性產生影響。但按照布蘭廷的說法,參與者最具啟發性的評論或許是他們難以理解,在突出顯示的文字與他們要決定的問題之間存在什麼聯絡。他們說不出那些突出顯示的部分與WIPO規則的重要概念“無權利或合法利益”之間有什麼關係。

儘管一個實驗並不具有決定性意義,但這一發現對多層注意力網路的注意力權重能夠解釋法律預測的結果而言,是一個打擊。布蘭廷指出,一個有用的結論支撐應該可以幫助其使用者理解案件記錄的有關部分與案件的爭議焦點和法律推理之間的關係。這是成功的法律解釋的目標。

法律知識對幫助使用者理解這種關聯而言是重要的,但問題是,人們如何將這些法律知識整合到文字分析的分析路徑當中?卡爾·布蘭廷於2020年在《人工智慧與法律雜誌》中發表的論文中描述了一種近期最有希望的研究專案。該論文的題目是《可擴充套件和可解釋的法律預測》。作者開發了一套名為SCALE的半自動檢測方法,用以從事實和法律認定方面對世界智慧財產權組織域名爭端案件進行註釋。文字註釋包括對案件裁判的文字進行標註,以確定資訊語義型別的例項。這些語義型別是文字中的一些關鍵概念,例如,法院對事實的認定、法律問題、案件中的因素,以及如引注等文字屬性。這些重要的語義型別被置於型別系統之中,這是一個概念與關係的位階等級,這樣一個註釋管道就可以學習自動為文字分配一些語義概念或意義。

研究人員使用了型別系統中的標籤,來對一小部分裁判的事實認定中的句子進行了註釋。SCALE標籤抓取在涉及域名爭端的世界智慧財產權組織的案件中出現的那些對特徵的構成十分關鍵的事實認定、法律問題、因素和屬性的型別。例如,無權利或合法利益問題,及其相關的在先商業使用等因素,都用綠色進行突出顯示。如前所述,無權利或合法利益源於世界智慧財產權組織關於域名爭端的規則。該規則強調在收到爭端通知前,對域名的善意商業使用的重要性。研究人員將一系列經註釋的例項,載入機器學習分類器,使其對WIPO資料庫中的所有案例中事實部分的句子按照標籤進行分類。在實驗中,他們證實了機器學習到的註釋能夠使程式合理預測案件的結果。預測結果也實現了合理的F1分數。除此之外,註釋內容能夠代表一些實質性的概念特徵,這些特徵可以用以解釋預測結果。

為什麼布蘭廷團隊會堅持適用SCALE的方法?因為他們想要得到一個能夠生成律師可以理解的法律解釋的系統,一個能夠幫助其使用者理解案件記錄的有關部分與案件的法律問題和推理之間關係的系統。關於從案例文字中提取諸如法律問題和法律要素等在法律上有意義的特徵,SCALE朝著這一方向邁出了驚人的一步。但機器學習程式可以用法律執業者能夠理解的術語和方式來解釋預測的結果。

SCALE的路徑在中國民法法系當中能否得到應用呢?我曾聽說過中國的指導性案例制度,中國的案例是否會對案例的實施情況進行完整的描述?中國的法學學者和律師是否如普通法系的法律執業者一樣,採用類比推理的方法對案件進行法律推理?如果是的話,這對中國的法律資訊檢索系統有什麼樣的影響?這些系統又是否會支撐以“知識”為基礎的法律論證?正是在這種關聯之上,SCALE方法對辨別那些與結果預測的解釋相關的法律問題和法律因素而言十分重要。法律知識能否幫助文字分析來解釋其結果預測,取決於中國的民法法系如何適用於具體的案件。

王 健 金惠珠

演講直擊|凱文·阿什利:法律文字分析與解釋的困境

往期精彩回顧

原標題:《演講直擊|凱文·阿什利:法律文字分析與解釋的困境》