聲明:本文來自于微信公眾號 頭號AI玩家(ID:AIGCplayer),作者:月山橘,授權(quán)轉(zhuǎn)載發(fā)布。
高考臨近,又到高考作文押題的賽點了!
最近,B站UP主“圖靈的貓”用AI預(yù)測出了2023年高考作文的七大命題方向,對應(yīng)高考的七套考卷。
用AI押題,聽上去不太靠譜,但這已經(jīng)不是這位UP主第一次用AI預(yù)測高考作文題了。
?
去年5月,他用AI預(yù)測2022年高考作文題,命中了全國乙卷、新高考II卷、北京卷II和浙江卷!
在他上個月發(fā)起的投票中,有超7成的參與者支持他繼續(xù)預(yù)測2023年的高考作文。
當然,押中與否是個概率問題,不見得百發(fā)百中。不過,用AI押題這件事是怎么實現(xiàn)的?需要花費多少時間和成本?帶著這些問題,我們和“圖靈的貓”聊了聊。
AI是如何預(yù)測高考作文題的?
作為擁有90萬粉絲的B站科技區(qū)UP主,“圖靈的貓”很擅長用技術(shù)“整活”,做一些有趣的開發(fā)實踐。
比如讓AI預(yù)測高考作文題、訓(xùn)練一個反詐AI跟騙子聊天、開發(fā)一個自動寫小說的免費網(wǎng)站等等,這些視頻都收錄在他名為“圖靈計劃”的合集里。
截至發(fā)稿前,他讓AI預(yù)測2022年和2023年高考作文題的兩條視頻,分別獲得了275萬和36.3萬的播放量。
以今年這條題為《爬遍全網(wǎng)數(shù)據(jù),我又用AI預(yù)測了2023年高考作文題》的視頻為例,“圖靈的貓”在視頻中介紹了讓AI預(yù)測高考作文題的原理和過程,并給出了AI的預(yù)測結(jié)果。
一共七大命題方向,每個命題方向包括三部分:核心詞、預(yù)測主題、模型表征。
對應(yīng)到高考作文,可以理解為中心思想、文章主題、與主題相關(guān)的描述或關(guān)鍵詞。
話不多說,我們先來點擊這里看看今年他用AI押題的最終結(jié)果。
那讓AI預(yù)測高考作文題的原理是什么呢?
首先要從高考作文的本質(zhì)出發(fā)。在“圖靈的貓”看來,高考作文本質(zhì)上是對考生價值觀、人生觀和家國意識的引導(dǎo)。
深諳此道的高考作文命題組,會從官媒文章、國家政策、政府指導(dǎo)意見和工作報告中,尋找規(guī)律和命題靈感。
而規(guī)律挖掘和數(shù)據(jù)分析,正是AI所擅長的。獲取的數(shù)據(jù)越多,分布越合理,AI就越能夠準確地預(yù)測。過程沒有感情,全是技巧。
基于以上原理和思考,“圖靈的貓”專門寫了一套爬蟲,爬取了近一年上千篇人民日報、央視新聞等官媒發(fā)表的文章,政府指導(dǎo)意見和工作報告。
然后把它們保存到本地,形成一個個文檔,再通過自然語言處理中的預(yù)訓(xùn)練模型和主題建模,對這些文檔進行理解和歸納,分為文化、教育、科研、國防、外交等主題,每個主題提取出一些具有代表性的關(guān)鍵詞,比如說科研主題下的“神十三”。
考慮到近來AI技術(shù)的迭代,相比于去年的預(yù)測,今年略有不同的是,他引入了ChatGPT作為輔助,更加智能地給出選題建議。
但由于ChatGPT的訓(xùn)練數(shù)據(jù),絕大多數(shù)來自英文互聯(lián)網(wǎng),對中文語境下的文本理解存在一些偏差。再加上聯(lián)網(wǎng)版的GPT模型,比如NewBing、GPT-4的插件等,都有調(diào)用接口限制,一般只能記住幾千個token或漢字。
如果直接用它們進行預(yù)測,得出的預(yù)測結(jié)果,往往都是基于搜索引擎前幾條的人為預(yù)測結(jié)果,而不是真的基于大數(shù)據(jù)的AI預(yù)測。
想要分析上千篇人民日報,如此大量的文本,需要一個不限制文本輸入長度的模型,因此往往只能部署在本地,但這與ChatGPT并不沖突。
他的做法是,使用本地模型完成第一輪主題歸納,然后將簡化的信息輸入ChatGPT,基于ChatGPT強大的泛化能力,判斷和預(yù)估不同主題和關(guān)鍵詞被選中的概率,起到類似命題指導(dǎo)組的作用。
而在花費的時間和成本上,圖靈的貓表示,去年由于是從0到1開發(fā)預(yù)測模型、爬數(shù)據(jù),所以耗時很久,但今年用時縮短很多。每個環(huán)節(jié)的耗時比例大概是:60%的時間抓取數(shù)據(jù),30%的時間用AI進行主題建模,然后剩下10%的時間人工對內(nèi)容進行規(guī)整。
他告訴我們:“目前ChatGPT二十多萬次的API調(diào)用,大概只要十幾美元,再加上已經(jīng)在本地對信息進行了處理和壓縮,所以總體消耗的token數(shù)量少很多,最終花費的成本并不高。”
AI押題,水平如何?
2023年高考作文預(yù)測結(jié)果的準確性,要等到幾天后才能見分曉。
“圖靈的貓”還發(fā)動態(tài)提醒大家:“高考完別忘了來看看準確率”。
我們回顧了UP主2022年的預(yù)測與高考真題,兩者雖然并不完全一致,但AI確實踩中不少要點。
比如,在2022年全國新高考II卷中,要求以“選擇·創(chuàng)造·未來”為題寫作,參考材料中提到了科學(xué)攻關(guān)、北斗導(dǎo)航系統(tǒng),并傳達出民族自主自強的精神。
2022年全國新高考II卷 作文題
而在AI給出的命題方向中,有一個以“探索、夢想”為核心詞,預(yù)測主題正是“科技發(fā)展、探索精神、自主自強”。真題材料中提到的“北斗”,也出現(xiàn)在模型表征中。
除此之外,全國乙卷、北京卷II和浙江卷的作文真題,也與AI預(yù)測的命題方向不謀而合。
一部分網(wǎng)友驚嘆:“高考命題組可以考慮一下反預(yù)測命題算法了”,還有人希望UP主預(yù)測一下中考題、四六級、考研題、考公題。
但由于這些考試的出題標準過于離散,沒有統(tǒng)一的命題規(guī)律和命題流程,各省市乃至學(xué)校之間都有很大不同,“圖靈的貓”認為預(yù)測意義不大。
也有一部分網(wǎng)友表示質(zhì)疑:
UP硬核“精準預(yù)測”的這些關(guān)鍵詞,哪個高三生耳朵沒聽出繭?
這些核心詞和主題都是過去一年的熱點,不用AI,我也能押。
AI可以窮舉,但重點劃得太多,相當于沒有重點。
還有網(wǎng)友從教育公平的原則出發(fā),認為很多地方的考生不了解互聯(lián)網(wǎng)及其衍生的文化,AI預(yù)測的“流浪地球”“孔乙己”“互聯(lián)網(wǎng)文學(xué)”等,高考作文顯然不會考。
還有考生表示,這些預(yù)測結(jié)果基本都在自己的語文老師押題范圍之內(nèi),有些甚至已經(jīng)在模擬考中遇到過了??碅I預(yù)測,頗有“聽君一席話,如聽一席話”的意味。
再加上命題組不按常理出牌也是常有的事,所以AI預(yù)測的意義或許并沒有想象中大。
對此,圖靈的貓認為,AI預(yù)測和人類預(yù)測在本質(zhì)上并無差別,都是基于經(jīng)驗?zāi)P瓦M行的,只能說是給學(xué)生備考提供一些方向。而圍繞主題進行擴展寫作,依然是對寫作能力、文字功底、價值觀等的考驗,押題并沒有多少短時間提分的奇效。
不過,如果真的能再次精準押中,那么高考命題組的老師們未來可能要進一步大開腦洞了。