【ITBEAR】8月10日消息,OpenAI公司于近日發(fā)布了一份詳盡報(bào)告,揭示了GPT-4o模型的系統(tǒng)卡(System Card)內(nèi)容,其中包含了外部紅隊(duì)測(cè)試、準(zhǔn)備框架(Preparedness framework)等多個(gè)關(guān)鍵細(xì)節(jié)。
報(bào)告指出,GPT-4o模型的核心在于其獨(dú)特的準(zhǔn)備框架(Preparedness framework),這是一種系統(tǒng)性的方法,旨在評(píng)估并降低人工智能系統(tǒng)所帶來(lái)的風(fēng)險(xiǎn)。據(jù)ITBEAR了解,該框架的應(yīng)用范圍廣泛,覆蓋了網(wǎng)絡(luò)安全、生物威脅、說(shuō)服技巧以及模型自主性等多個(gè)領(lǐng)域,致力于識(shí)別這些領(lǐng)域內(nèi)可能存在的潛在危險(xiǎn)。
除了對(duì)GPT-4和GPT-4V進(jìn)行的安全評(píng)估和緩解措施外,OpenAI還針對(duì)GPT-4o的音頻功能加強(qiáng)了安全工作。這些評(píng)估涵蓋了揚(yáng)聲器識(shí)別、未經(jīng)授權(quán)的語(yǔ)音生成、可能侵犯版權(quán)的內(nèi)容生成、無(wú)根據(jù)的推斷以及不允許的內(nèi)容等多個(gè)方面。基于這些細(xì)致的評(píng)估結(jié)果,OpenAI在模型和系統(tǒng)層面均實(shí)施了相應(yīng)的保障措施,以確保其音頻功能的穩(wěn)健性和安全性。
在模型發(fā)布之前,OpenAI還與100多名外部紅隊(duì)人員進(jìn)行了緊密合作,共同對(duì)模型進(jìn)行了全面的評(píng)估。這些紅隊(duì)人員負(fù)責(zé)進(jìn)行探索性的能力發(fā)現(xiàn),評(píng)估模型可能帶來(lái)的新風(fēng)險(xiǎn),并對(duì)已實(shí)施的緩解措施進(jìn)行了嚴(yán)格的壓力測(cè)試,以確保模型在實(shí)際應(yīng)用中的穩(wěn)定性和安全性。