【ITBEAR】近日,國家知識(shí)產(chǎn)權(quán)局披露了一項(xiàng)來自北京百度網(wǎng)訊科技有限公司的專利申請(qǐng),該專利名為“基于大模型的樣本生成方法、模型訓(xùn)練方法、排序方法、裝置及設(shè)備”,其公開號(hào)為CN 118779691 A,申請(qǐng)于2024年6月提交。此專利聚焦于人工智能技術(shù)領(lǐng)域,尤其涉及智能搜索、深度學(xué)習(xí)、自然語言處理以及大模型技術(shù)的創(chuàng)新應(yīng)用。
據(jù)專利摘要所述,該技術(shù)方案首先響應(yīng)樣本生成請(qǐng)求,該請(qǐng)求中包含示例樣本及其問題示例作為基礎(chǔ)語料。隨后,從指標(biāo)數(shù)據(jù)庫中選定多個(gè)初始指標(biāo),并據(jù)此生成多個(gè)備選問題。接著,針對(duì)每個(gè)備選問題,從初始指標(biāo)中召回相應(yīng)的多個(gè)備選指標(biāo)。最終,利用這些備選問題及其對(duì)應(yīng)的備選指標(biāo),結(jié)合基礎(chǔ)語料,生成多個(gè)目標(biāo)樣本。
該專利的提出,標(biāo)志著百度在大模型應(yīng)用領(lǐng)域取得了新的進(jìn)展,特別是在樣本生成、模型訓(xùn)練及排序方法上的創(chuàng)新。這一技術(shù)有望為智能搜索、自然語言處理等領(lǐng)域帶來更為高效和精準(zhǔn)的解決方案。