近期,谷歌正在“爭分奪秒”地準備在今年秋天發布 Gemini AI,以趕上 OpenAI 的 GPT-4 等競爭對手。
Gemini AI 在今年6月首度公開,將由先進的機器學習算法提供支持,使其能夠理解自然語言并以對話方式響應用戶查詢。谷歌龐大的訓練數據可以讓 Gemini 在人工智能軍備競賽中占據優勢。與 GPT-4 不同,Gemini 也是第一個可以處理視頻以及文本和圖像的多模態模型。
此外,Gemini 預計將用于多種 google 產品,包括 Bard 聊天機器人、電子郵件助手和搜索引擎。
報告表明,Gemini AI 在多模式能力方面取得了顯著進步,超越了以前的模型。不僅可以進行文本生成,還支持根據文本描述創建圖像。這意味著它可以處理和理解不同形式的數據,并且在工具和 API 集成方面非常高效。
它可以進行聊天對話、分析圖表數據、創建圖像,甚至可以通過自然語言命令控制軟件。與谷歌 Bard 聊天機器人的集成將有助于谷歌云與 Microsoft Azure 等產品競爭。
在 5 月的 I/O 2023 期間,谷歌指出 Gemini 正在接受培訓,一旦經過微調,它將可以“以各種尺寸和功能”使用,就像 PaLM 2 一樣。該公司表示,它可以部署在不同的產品中,為每個人帶來利益。
除了在企業服務中的應用之外,Gemini 在醫療用例方面還擁有巨大的潛力。谷歌一直在測試一款名為 Med-PaLM 2 的人工智能工具,該工具可以通過 Gemini 功能得到增強。該模型可用于醫療聊天機器人或機器人技術,以協助手術和醫療程序。
此外,谷歌在構建 DeepMind 的 Gato(一種“通用”系統)以及最近推出的 RT-2(一種機器人 Transformer 模型)方面的見解也可以集成到 Gemini 中。Google Brain 和 DeepMind 之間的合作對 OpenAI 和人工智能領域的其他競爭對手構成了重大挑戰。
據悉,Gemini 還對 YouTube 視頻進行了訓練,這使其比競爭對手更具優勢。它可以訪問龐大的視頻庫 YouTube,并受益于比 GPT-4 和 PaLM 2 更多的令牌進行訓練。增加的訓練數據使 Gemini 更聰明,更不容易出錯。然而,谷歌對有關訓練數據的法律問題持謹慎態度,并通過法律團隊的監控確保遵守版權法。
自ChatGPT誕生以來,DeepMind 和 Google 都針對 ChatGPT 制定了自己的應對措施,DeepMind 創建了 Project Goodall,而 Google 則推出了 Bard。該公司還在其搜索引擎和許多其他產品中使用了生成式人工智能。為了加速人工智能研究,該公司于4月份將 Hassabis 的 DeepMind 團隊與谷歌的主要人工智能實驗室 Brain 合并,創建了Google DeepMind。
據稱,谷歌還表示,今年秋天發布 Gemini AI 的時機至關重要,谷歌當下正面臨著在 AI 層面“掉隊”的危險。