【ITBEAR科技資訊】5月15日消息,近日,OpenAI發布的新一代AI模型GPT-4o,該模型能實時進行音頻、視覺和文本推理,立即引發了業界的廣泛關注。對此,360集團創始人、董事長周鴻祎也通過視頻分享了自己對于GPT-4o技術原理及潛在社會影響的理解。
周鴻祎在視頻中首先解析了GPT-4o的技術原理。他提到,OpenAI在發布會上簡要介紹了其技術原理,這一技術并非傳統地將語音翻譯成文字處理后再翻譯回語音,而是直接處理語音,構建了一個綜合的大模型引擎,能夠直接理解語音輸入,包括語音中的情緒、語調、口音等細節,并能以語音形式直接輸出。
據ITBEAR科技資訊了解,GPT-4o帶來的全新體驗中,響應時延大約只有300毫秒,已經達到了人類間自然對話的速度。這不僅能讓人工智能聽懂我們話語中的情緒,還可以在回答問題時表達出高興、悲傷、失望、興奮等復雜的情緒。
此外,周鴻祎還強調了GPT-4o的另一項重要功能,那就是可以直接通過手機攝像頭獲取視覺信息,從而大大提升了其視覺處理能力。他認為,盡管這一功能可能尚不及Sora,但相較于GPT-4.5只能處理圖片和表格的輸入,GPT-4o無疑又向前邁進了一步。
在周鴻祎看來,GPT-4.0為人工智能賦予了理解知識的能力,如同擁有了一個大腦;GPT-4.5則為其增添了一些初級的視覺能力;而GPT-4o,無疑是為其增加了能夠真正理解世界、聽懂人言、并自由表達情感的“眼睛”和“耳朵”。
周鴻祎提到,盡管有些人對OpenAI沒有推出GPT-5.0感到失望,但通用人工智能的發展并不僅僅是在推理能力、知識能力、邏輯能力上趕超人類,更重要的是要提升其與人交互的能力。當AI能通過手機或物聯網攝像頭更好地理解世界,并能以接近人類的響應速度進行交互時,這將使人工智能更加接近真人,其影響將是深遠的。