【ITBEAR科技資訊】7月31日消息,據最新研究顯示,大型語言模型(LLM)的費用受到使用語言的顯著影響,可能加劇英語和其他語言使用者之間的人工智能鴻溝。該研究發現,由于計費方式的不同,英語輸入和輸出的費用相較于其他語言要低得多,其中簡體中文費用約為英語的兩倍,西班牙語為英語的1.5倍,而緬甸撣語則高達英語的15倍。
根據牛津大學開展的調查,讓大型語言模型處理一句緬甸語句子需要198個詞元,而同樣的句子用英語書寫只需17個詞元。詞元代表了通過API訪問大型語言模型所需的計算力成本,這也意味著使用緬甸語句子的服務成本比英語高出了11倍。
詞元化模型將用戶輸入轉換為計算成本的方式,這導致了不同語言使用和訓練模型的費用差異。例如,中文等語言因其復雜的結構(無論是從語法還是字符數量上),需要更高的詞元化率。例如,在英語中,表達"你的愛意"這四個字符的詞元只需兩個,而在中文中則需要八個詞元。
這種費用差異可能帶來一系列問題,比如限制其他語言用戶訪問大型語言模型的機會,或者使得使用其他語言的人們在開發和創新人工智能應用時承受更高的經濟壓力。這也可能加劇英語和非英語使用者之間的技術鴻溝,因為英語使用者更容易使用和訪問這些語言模型。
據ITBEAR科技資訊了解,解決這一問題的途徑之一是推動普惠且包容的人工智能技術發展,包括降低其他語言使用者使用大型語言模型的費用,并更公平地對待不同語言的用戶。這需要技術公司、研究機構和政府通力合作,確保人工智能技術的普及和發展能夠惠及全球各地的人們,而不僅局限于英語使用者。