【ITBEAR科技資訊】05月17日消息,人工智能(AI)領域的迅猛發展帶來了大量術語,其中包括生成式AI、訓練數據、算法偏差等專業術語。這些術語對于希望進入這一領域的人來說至關重要。ITBEAR科技資訊將為您介紹一些人工智能的專業術語,幫助您在這個快速發展的領域中取得進展。
生成式AI是一種人工智能技術,它可以創造文本、圖像、聲音和視頻等內容。與傳統的人工智能應用主要側重于對內容進行分類不同,生成式人工智能模型能夠創造內容。例如,語音識別模型可以識別您的聲音,而生成語音模型則可以使用您的聲音創造有聲讀物。近期引起公眾關注的許多模型都屬于生成式AI,包括ChatGPT等聊天機器人,以及穩定擴散和midjourney等圖像生成器,還有esemble等語音克隆程序。
訓練數據是用于幫助人工智能模型完成任務的文本、圖像、聲音等信息的集合。在語言模型中,訓練數據集主要基于文本,例如書籍、社交媒體評論甚至代碼。然而,低質量的訓練數據可能會引入偏見,導致模型做出不公平的決策,表現出種族主義或性別歧視。據ITBEAR科技資訊了解,算法偏差是由于訓練數據質量不佳和編程錯誤導致的,使得模型做出有偏見的決策。這些模型可能會基于性別、能力或種族做出不恰當的假設,從而對決策產生嚴重危害。一些批評人士對人工智能過快發展提出了擔憂,指出算法偏見的潛在風險。
人工通用智能(AGI)是描述一種與人類具有相似甚至更強能力的程序。雖然全面的通用智能尚未實現,但模型正在變得越來越復雜。自主代理是一種擁有目標并具備足夠工具來實現目標的人工智能模型。例如,自動駕駛汽車就是一種自主代理,它通過感官輸入、GPS數據和駕駛算法獨立決定導航和到達目的地的方式。斯坦福大學的研究人員已經證明,一組自主主體甚至可以發展出文化和傳統。
提示鏈是利用與AI模型之前交互的信息來創建更準確的響應過程的技術,尤其在提示驅動的語言建模中應用廣泛。例如,當您讓ChatGPT給您的朋友發短信時,您希望它能記住您和她之間的語氣、笑話和以前的對話內容。這些技術有助于整合上下文信息。
大型語言模型(LLM)是一種人工智能應用,通常是生成式的。這些模型的特點是規模龐大,例如最大的版本GPT-3包含1750億個參數,并在570GB的數據上進行了訓練。谷歌的PaLm模型更大,有5400億個參數。隨著硬件和軟件的不斷發展,預計這種規模還將繼續增加。然而,這些模型也可能存在問題,如編造學術引用、對您要求其分析的數據撒謊,或編造訓練數據中不存在的事件事實。
幻覺是指人工智能程序出現意外和錯誤的反應,可能是由于尚未完全理解的原因產生的。例如,當您詢問如何種植果樹時,語言模型可能會突然給出水果沙拉的食譜。目前尚不清楚為什么會發生這種情況,但可能與數據稀缺、信息缺失和錯誤分類有關。
突發性行為是指人工智能可能表現出并非專門設計用于的技能。例如,解釋表情符號、理解諷刺和使用性別包容的語言都屬于突發性行為。
一致性是指努力確保人工智能系統與其人類操作員具有相同的價值觀和目標。為了實現一致性,研究人員致力于訓練和校準模型,通常使用函數來獎勵或懲罰模型。
多模態人工智能是一種能夠理解和處理多種類型信息(如文本、圖像、語音等)的人工智能形式。這種能力非常強大,因為它使得人工智能在多個維度上都能理解和表達自己,從而對任務有更廣泛和更細致的理解。例如,多模態人工智能可以將日語漫畫翻譯成英語。
提示工程是給予人工智能指令的行為,以使其具備實現您目標所需的環境。提示工程與OpenAI的ChatGPT緊密相關,它描述了用戶輸入算法的任務,例如“給我五個流行的嬰兒名字”。
訓練是指使用數據來精細調整人工智能的過程,使其更適合完成特定任務。您可以使用包含希望人工智能學習的內容的數據來進行訓練,就像將莎士比亞的十四行詩輸入到一個詩歌機器人中一樣。您可以在稱為"epoch"的迭代中多次進行訓練,直到模型的性能達到一致可靠。
神經網絡是一種近似人類思維結構的計算機系統,它允許模型從抽象到具體進行建模。
狹義人工智能是指一些具有單一思維功能的AI算法,它們被設計成只能完成特定任務。例如,如果一個狹義人工智能算法可以下棋,那么它就不能下國際象棋。