近日,中國法律智能技術(shù)評測CAIL (Challenge of AI in Law) 公布大賽結(jié)果。華為云盤古大模型團(tuán)隊以NDCG@30分值0.943的總成績奪得類案檢索賽道第一名,從100多支參賽隊伍中脫穎而出。
中國法律智能技術(shù)評測由最高人民法院司改辦和中國中文信息學(xué)會指導(dǎo),旨在促進(jìn)智能技術(shù)賦能司法,實現(xiàn)更高水平的數(shù)字正義,從2018年起已連續(xù)舉辦了四屆,先后吸引了來自海內(nèi)外高校、企業(yè)和組織的近5000支隊伍參賽,成為中國法律智能技術(shù)評測的重要平臺。
本次大賽共吸引了全球?qū)W術(shù)界和工業(yè)界的眾多研究者和開發(fā)者參加,其中既有來自北大、清華等國內(nèi)外頂尖學(xué)術(shù)機構(gòu)的科研人員,也有來自微軟、谷歌的優(yōu)秀工程師。
華為云盤古大模型團(tuán)隊獲中國法律智能技術(shù)評測類案檢索賽道第一名
類案檢索,即從海量裁判文書當(dāng)中快速定位和查詢與某一案件最為接近的案例、法條、法規(guī)。作為人工智能支持司法審判的重要內(nèi)容,類案檢索技術(shù)對于提升法院整體裁判水平、實現(xiàn)類案適法統(tǒng)一、促進(jìn)司法公正有極其重要的積極意義,其應(yīng)用場景涵蓋公檢法司、律所、公司法務(wù)等。
CAIL 2022類案檢索賽道任務(wù)設(shè)置為刑事類案搜索,具體任務(wù)為給定若干查詢案例,每一個查詢案例均對應(yīng)一個大小為100的候選案例池,要求參賽團(tuán)隊從候選案例池中篩選出與每一個查詢案例相關(guān)的類案。每個查詢案例最終的提交形式為對應(yīng)的100個候選案例的排序,預(yù)測越相似的案例排名越靠前。
類案檢索存在三個任務(wù)難點:
(1)首先,類案檢索任務(wù)中的相關(guān)性判別機制與傳統(tǒng)檢索任務(wù)有較大差異,不僅需要判斷文本的相似性,更需要識別案件在法律問題和法律程序方法的相似性,同時也存在著“大量文本相同但不是相關(guān)案例”的場景,如酒駕和醉駕、交通肇事和危險駕駛、故意傷害罪中的“不同傷殘等級”等。
(2)其次,人工標(biāo)注的高質(zhì)量類案數(shù)據(jù)量稀少,其主要原因是標(biāo)注門檻高,需要有法律專業(yè)知識的人來標(biāo)注,并且標(biāo)注速度很慢。
(3)第三,司法文書的長度平均幾千字,遠(yuǎn)超一般預(yù)訓(xùn)練模型處理上限。
為了解決類案相關(guān)性判別的難點,華為云盤古大模型團(tuán)隊在向量檢索模型學(xué)習(xí)時針對類案判別機制設(shè)計了新的預(yù)測函數(shù),可以有效地識別出司法文書中的“要件事實”和“案情事實”;針對標(biāo)注數(shù)據(jù)少的難點,華為云利用盤古大模型的小樣本學(xué)習(xí)能力,在中文預(yù)訓(xùn)練模型(即NLP大模型)的基礎(chǔ)上進(jìn)行微調(diào);此外,華為云利用相似案例之間的傳遞性,設(shè)計了數(shù)據(jù)增強的方案,并進(jìn)一步設(shè)計了根據(jù)學(xué)習(xí)情況對訓(xùn)練正樣本和負(fù)樣本動態(tài)采樣的策略。針對原始超長文書,華為云采用窗口化分塊處理,并在處理后進(jìn)行表示聚合增強模型效果。最終,華為云盤古大模型團(tuán)隊以NDCG@30分值0.943的總成績大幅領(lǐng)先其余隊伍,在100多支隊伍中名列第一。
近年來,國務(wù)院發(fā)布《新一代人工智能發(fā)展規(guī)劃》,明確提出建設(shè)“智慧法院”,“促進(jìn)人工智能在證據(jù)收集、案例分析、法律文件閱讀與分析中的應(yīng)用,實現(xiàn)法院審判系統(tǒng)和審判能力智能化”。同時,大量司法公開數(shù)據(jù),為法律大數(shù)據(jù)的開發(fā)和人工智能的應(yīng)用提供了可能。如何將人工智能技術(shù)應(yīng)用在司法領(lǐng)域,輔助司法工作者提升案件處理的效率和公正性,逐漸成為法律智能研究的熱點。
華為云盤古大模型團(tuán)隊正在基于盤古NLP大模型構(gòu)建司法領(lǐng)域大模型,面向公檢法、律所和公司法務(wù),賦能一系列下游應(yīng)用,包括類案檢索、法條推薦、司法信息抽取、罪名匹配等等。歡迎感興趣的專家交流討論,一起促進(jìn)人工智能技術(shù)在智慧司法領(lǐng)域的發(fā)展。