作為當前最火的AI應用,ChatGPT在積累了1億用戶之后開始嘗試商業運營了,昨天正式發布了API,企業可以付費接入,75萬單詞只要2美元,成本比之前降低了90%。
實際上昨天開放的業務還有一個,那就是語音轉文字的API,基于公司的Whisper大模型,去年9月份首次推出Whisper Large-v1模型,12月開源了升級版的Whisper Large-v2模型。
這次商業化之后,Whisper API的收費也很低廉,每分鐘只要0.006美元,人民幣約為4分錢,預計會讓很多語音相關的企業壓力很大。
Whisper API支持對語音文件進行轉錄和翻譯,并支持包括英語、中文、阿拉伯語、日語、德語、西班牙語等幾十種語言。
不過不同語言的準確率差別不小,Whisper large-v2模型在識別西語、英語、意大利語、德語等語言單詞錯誤率都能控制在5%以內,這種語言轉文字之后只需要用戶簡單修改就好。
至于中文,v1模型的錯誤率就有19.6%,v2略微提升到14.7%,改進不大,錯誤率比英文、西語之類的高很多,用戶使用起來有些麻煩,需要校正的地方就多。
至于為何有這樣的差距,除了中文自身的特點之外,很可能跟訓練使用的中文語料較少有關,畢竟網上的內容主要還是外文。
來源:快科技