Gemini是谷歌開發(fā)的一個(gè)新模型。有了Gemini可以為查詢提供圖像、音頻和文本,獲得幾乎完美的答案。
我們?cè)诒窘坛讨袑W(xué)習(xí)Gemini API以及如何在機(jī)器上設(shè)置它。我們還將探究各種Python/ target=_blank class=infotextkey>Python API函數(shù),包括文本生成和圖像理解。
Gemini AI模型介紹
Gemini是谷歌研究院和谷歌DeepMind等團(tuán)隊(duì)合作開發(fā)的新型AI模型。它為多模態(tài)而建,理解并處理不同類型的數(shù)據(jù),比如文本、代碼、音頻、圖像和視頻。Gemini是谷歌迄今為止開發(fā)的最先進(jìn)、最龐大的AI模型。它非常靈活,可以從數(shù)據(jù)中心到移動(dòng)設(shè)備的各種系統(tǒng)上高效運(yùn)行。這意味著它有望徹底改變企業(yè)和開發(fā)人員構(gòu)建和擴(kuò)展AI應(yīng)用程序的方式。
以下是針對(duì)不同用例設(shè)計(jì)的Gemini模型的三個(gè)版本:
- Gemini Ultra:最龐大最先進(jìn)的AI,能夠執(zhí)行復(fù)雜的任務(wù)。
- Gemini Pro:一種良好性能和可擴(kuò)展性兼?zhèn)涞哪P汀?/li>
- Gemini Nano:最適合移動(dòng)設(shè)備。
Gemini Ultra具有最先進(jìn)的性能,在幾個(gè)指標(biāo)上超過(guò)了GPT-4的性能。它是第一個(gè)在大規(guī)模多任務(wù)語(yǔ)言理解基準(zhǔn)測(cè)試中超越人類專家的模型,該基準(zhǔn)測(cè)試57個(gè)不同學(xué)科的世界知識(shí)和解決問(wèn)題的能力。這展示了其先進(jìn)的理解和解決問(wèn)題的能力。
設(shè)置
要使用API,我們必須先獲得一個(gè)API密鑰,可以從這里獲?。篽ttps://ai.google.dev/tutorials/setup。然后,點(diǎn)擊“獲取API密鑰”按鈕,隨后點(diǎn)擊“在新項(xiàng)目中創(chuàng)建API密鑰”。
復(fù)制API密鑰并將其設(shè)置為環(huán)境變量。我們使用Deepnote,很容易設(shè)置名為“GEMINI_API_KEY”的密鑰。只要轉(zhuǎn)入到集成,向下滾動(dòng)并選擇環(huán)境變量。
在下一步中,我們將使用PIP安裝Python API: