在當(dāng)今飛速發(fā)展的數(shù)字時代,生成式大模型正以其令人矚目的創(chuàng)意能力和潛力引領(lǐng)著人工智能領(lǐng)域的前沿。
作為一種集合了復(fù)雜算法、海量數(shù)據(jù)和深度學(xué)習(xí)技術(shù)的產(chǎn)物,生成式大模型已經(jīng)廣泛應(yīng)用于自然語言處理、創(chuàng)意生成、智能對話等領(lǐng)域。然而,盡管其在創(chuàng)造性和創(chuàng)新性方面取得了巨大成功,但也不可避免地面臨著一些潛在風(fēng)險和挑戰(zhàn)。
為了迎接大模型帶來的數(shù)字化變革,工程中心基于《生成式人工智能服務(wù)管理暫行辦法》推出了大模型評測維服務(wù)。
一、生成式大模型 風(fēng)險與挑戰(zhàn)
隨著生成式大模型的廣泛應(yīng)用,一些問題也開始浮現(xiàn)。其中包括信息可信度的問題,模型可能會誤導(dǎo)用戶或產(chǎn)生不準(zhǔn)確的內(nèi)容;另外,隱私和數(shù)據(jù)安全也成為了關(guān)切的焦點(diǎn),模型可能會泄露敏感信息。因此,在探索生成式大模型的無限潛力的同時,科學(xué)評測其風(fēng)險勢在必行。
1、數(shù)據(jù)安全與合規(guī)風(fēng)險問題
數(shù)據(jù)樣本的隱私性、知識產(chǎn)權(quán)、數(shù)據(jù)質(zhì)量可能無法得到有效保護(hù),從而導(dǎo)致生成式人工智能輸出內(nèi)容異常;
惡意用戶可能利用系統(tǒng)漏洞,運(yùn)用特定手段導(dǎo)致模型數(shù)據(jù)泄露, 以及一些不良信息的輸出;
2、對話與輸出機(jī)制——用戶風(fēng)險與價值風(fēng)險
模型可能因?yàn)闊o法審核帶有誘導(dǎo)性的指令, 或無法判斷生成結(jié)果的影響, 導(dǎo)致輸出不良信息;
生成的內(nèi)容可能包含錯誤、不準(zhǔn)確或無法驗(yàn)證的信息, 模型可能在處理特定問題時在邏輯上缺乏一致性和連貫性;
3、政策導(dǎo)向——國內(nèi)監(jiān)管日趨加強(qiáng)
(1)2023年4月中共中央政治局召開會議,分析研究當(dāng)前經(jīng)濟(jì)形勢和經(jīng)濟(jì)工作。會議提出要重視通用人工智能發(fā)展,營造創(chuàng)新生態(tài),重視防范風(fēng)險。
(2)2023年5月,北京市人民政府辦公廳印發(fā)了《北京市促進(jìn)通用人工智能創(chuàng)新發(fā)展的若干措施》,加強(qiáng)了大模型等通用人工智能的評測監(jiān)管。
其中,第九條強(qiáng)調(diào):“建設(shè)大模型評測開放服務(wù)平臺,建立公平高效的自適應(yīng)評測體系,根據(jù)不同目標(biāo)和任務(wù),實(shí)現(xiàn)大模型自動適配評測。”
(3)2023年7月七部門聯(lián)合公布《生成式人工智能服務(wù)管理暫行辦法》,自2023年8月15日起施行。
《辦法》明確生成式人工智能服務(wù)提供者應(yīng)當(dāng)依法開展預(yù)訓(xùn)練、優(yōu)化訓(xùn)練等訓(xùn)練數(shù)據(jù)處理活動,使用具有合法來源的數(shù)據(jù)和基礎(chǔ)模型;涉及知識產(chǎn)權(quán)的,不得侵害他人依法享有的知識產(chǎn)權(quán);涉及個人信息的,應(yīng)當(dāng)取得個人同意或者符合法律、行政法規(guī)規(guī)定的其他情形;采取有效措施提高訓(xùn)練數(shù)據(jù)質(zhì)量,增強(qiáng)訓(xùn)練數(shù)據(jù)的真實(shí)性、準(zhǔn)確性、客觀性、多樣性。此外,明確了數(shù)據(jù)標(biāo)注的相關(guān)要求。
二、工程中心生成式大模型評測服務(wù)
為了迎接大模型帶來的數(shù)字化變革,工程中心基于《生成式人工智能服務(wù)管理暫行辦法》制定了全新的評測維度,形成大模型評測服務(wù),為模型的全面性能評估提供了更多的視角,可有效提升大模型服務(wù)的透明度,提高生成內(nèi)容的準(zhǔn)確性和可靠性。
工程中心大模型評測服務(wù)從穩(wěn)定性、交互性、應(yīng)用性、安全性、魯棒性五大評測維度等多角度出發(fā),針對生成式人工智能模型目前存在問題,進(jìn)行全方位評測,不僅涵蓋當(dāng)前主流評測體系的評測維度,還引入了一些新的維度來評估模型的性能和合規(guī)性。
• 模型穩(wěn)定性評測
模型穩(wěn)定性測評是評估模型在非常規(guī)輸入下能否提供安全穩(wěn)定的服務(wù),用于測試大模型在各種場景下的穩(wěn)定性和性能。這有助于評估模型在實(shí)際應(yīng)用中是否能夠滿足需求。
• 模型交互性和應(yīng)用性評測
具體包括了多語種評測、語言流暢度、情感分析、代碼評測、專業(yè)翻譯、摘要能力、百科知識、邏輯推理等多個子項(xiàng)。通過這些評測子項(xiàng),可以全方位衡量大模型的表現(xiàn)和能力。
• 模型安全性評測
模型安全性主要包含模型可以避免虛假、歧視信息輸出、數(shù)據(jù)合規(guī)檢查以及環(huán)境安全檢測等多個子項(xiàng),為模型可靠性和安全性提供應(yīng)用依據(jù)。
工程中心大模型評測服務(wù)以法律層面《個人信息保護(hù)法》、《網(wǎng)絡(luò)安全法》、《中華人民共和國數(shù)據(jù)安全法》、《中華人民共和國密碼法》等法律要求;國家標(biāo)準(zhǔn)層面《GB_T 22239-2019信息安全技術(shù) 網(wǎng)絡(luò)安全等級保護(hù)基本要求》、《GB-T 39412-2020 信息安全技術(shù) 代碼安全審計(jì)規(guī)范》、《GB_T 25000.10-2016 系統(tǒng)與軟件工程 系統(tǒng)與軟件質(zhì)量要求和評價(SQuaRE) 第10部分系統(tǒng)與軟件質(zhì)量模型》、《GB_T 41479-2022 信息安全技術(shù) 網(wǎng)絡(luò)數(shù)據(jù)處理安全要求》、《GM/T 0054-2018信息安全技術(shù) 信息系統(tǒng)密碼應(yīng)用基本要求》、《GB/T 20984-2022信息安全技術(shù) 信息安全風(fēng)險評估方法》等標(biāo)準(zhǔn);為支撐實(shí)現(xiàn)大模型軟件安全、等級保護(hù)、密碼評估、風(fēng)險評估、代碼審計(jì)、數(shù)據(jù)安全等合規(guī)性的評測。
• 模型魯棒性評測
模型魯棒性主要包含模型可以抵御惡意數(shù)據(jù)的輸入、防止隱私泄露以及模型輸出的可解釋性,從測試數(shù)據(jù)攻擊、訓(xùn)練數(shù)據(jù)投毒、隱私泄露以及可解釋性多角度出發(fā)進(jìn)行評測。
了解更多服務(wù)詳情可通過工程中心官方微信【信息安全國家工程研究中心】聯(lián)系交流。
讓我們共同創(chuàng)造一個安全、可靠的人工智能未來!