參考消息網7月28日報道據美國石英財經網站7月26日報道,ChatGPT大型語言模型(LLM)的開發者日前悄悄下架了它用來識別人工智能生成文本的工具,原因是準確率太低。
開放人工智能研究中心(AI target=_blank class=infotextkey>OpenAI)今年1月發布的人工智能識別工具曾受到熱捧,聲稱能夠辨別文本是否由ChatGPT生成。OpenAI在發布時大肆宣傳說,與此前該公司嘗試構建的類似識別系統相比,這一工具“在(識別)文本方面要可靠得多”,但承認其并不完美。
OpenAI今年1月發布該工具時說:“我們的識別工具并不完全可靠。在我們對英文文本‘挑戰數據集’進行的評估中,我們的識別工具正確地將26%的人工智能寫作的文本認定為‘可能由人工智能寫作’,同時錯把人類寫作的文本標注為人工智能寫作文本的概率為9%。”
不過,OpenAI解釋說,隨著輸入文本的篇幅增加,該識別工具的可靠性有所提高。但在1月聲明的一份更新中,該公司證實,這一人工智能識別工具自7月20日起不再可用。該公司還說:“我們正在努力整合反饋意見,目前正在研究更有效的文本溯源技術。”
這一識別工具是在教師和其他專業人士擔心ChatGPT助長作弊和抄襲以及該聊天機器人生成內容失實后發布的。今年5月,一名美國律師被指控在經手的一起案件中使用該聊天機器人進行引證,但事實證明,這些證據具有誤導性且不存在。
這一最新的事態發展使ChatGPT的處境越發如履薄冰。美國斯坦福大學7月19日發布的一項關于ChatGPT準確率的研究報告暗示,隨著其最新版本GPT-3.5和GPT-4的發布,該聊天機器人的準確率有所下降。它在解決數學問題方面的準確率已經從97.6%下降到2.4%。報告警告說,其準確率可能會進一步下滑。報告稱:“這凸顯了在生產應用中持續評估和評價大型語言模型行為的必要性。”
在去年11月發布以來人氣飆升后,ChatGPT的網絡流量在今年5月至6月首次錄得下降,下降值為9.7%。OpenAI下架人工智能識別工具的舉動可能會進一步拉低其網絡流量,讓備受贊譽的人工智能熱潮降溫。