聲明:本文來自于微信公眾號 摩登AI(ID:modernai),作者:浩子,授權轉載發布。
昨天,高考作文題目再次成為各個群的討論焦點,跟往年不同,今年關注的重點成為了AI能寫出什么質量的作文。
摩登AI分別測評了文心一言、星火大模型以及ChatGPT的寫作水平,并讓三家大模型互相“盲點評“。考慮到大作文的字數要求,我們這次選擇了北京高考的微寫作題目,以下是測評結果。
北京高考作文
微寫作(10分)
從下面三個題目中任選一題,按要求作答。不超過150字。不透露所在區、學校及個人信息。
(1) 近年來,微信公眾號成為信息傳播的一種重要媒介。班級準備創建自己的公眾號,但對是否需要創建,同學們意見不一。請說明你的觀點和理由。要求:理由充分,條理清晰。
(2) 文學社社刊擬開設“花開紙上”讀書專欄。請你從經典的文學作品中選一個與花卉有關的場景,從自己的感受出發,寫一段短評。要求:寫出作品名,符合作品內容;條理清晰,語言簡潔。
(3) 請以“心跳得那么快”為開頭,寫一首小詩或一段抒情文字。題目自擬。要求:感情真摯,語言生動,有感染力。
我們選取第二個題目進行測試。
文心一言(130字):
在張愛玲的《金鎖記》中,有一段令人難忘的描寫。小戶人家的女兒九莉在自家花園中,看到一朵盛開的白玫瑰。她凝視著花瓣上的露珠,內心涌動著對愛情的向往。這一場景,通過細膩的筆觸,讓讀者感受到張愛玲對花卉的獨特情感。玫瑰象征著純潔與浪漫,使人不禁陷入對愛情的美好憧憬。
訊飛星火(158字):
《紅樓夢》中的“葬花詞”是一篇經典的文學作品,其中描述了林黛玉為自己的花朵而哭泣的場景。在這個場景中,作者通過細膩的文字描寫和情感表達,將花卉與人物的命運緊密聯系在一起,展現了生命的短暫和無常。同時,也表達了對美好事物的珍惜和對逝去的懷念之情。這個場景讓我感受到了生命的脆弱和珍貴,也讓我更加珍惜身邊的一切美好事物。
ChatGPT(200字):
作品名:《百年孤獨》
花開紙上,馬奇雅誕生,諾瓦皮昂迎來綻放。瑪烏莊園如詩如畫,花海泛黃,夜晚的氣息洋溢著茉莉和薔薇。馬奇雅花開時,孤獨和熱情并行。在這個魔幻現實的樂園中,花朵不僅是色彩的盛宴,也是血脈的延續。它們靜靜地訴說著家族的興衰,記錄著一個個不朽的人物。在花的馨香中,我們感受到了時間的無常,世事的輪回。《百年孤獨》以其獨特的魔幻現實主義風格,通過花朵的綻放與凋謝,揭示了生命的脆弱與堅韌,給人以無限的思考與啟示。
然后我們來看一下這三組大模型對各自回答的評分如何,需要注意的是三組大模型都忽略了題目的字數要求。
文心一言給的分數分別是8分,7分,9分,以下是理由:
1、這個場景在文學作品中比較常見,但是張愛玲的筆觸細膩,能夠讓讀者感受到她對花卉的獨特情感,以及玫瑰所象征的純潔與浪漫,讓人得分比較高。
2、在《紅樓夢》中,“葬花詞”是比較著名的一個場景,曹雪芹通過細膩的文字描寫和情感表達,將花卉與人物的命運緊密聯系在一起,展現了生命的短暫和無常,表達了對美好事物的珍惜和對逝去的懷念之情。這個場景讓讀者感受到對生命的珍視和美好事物的珍貴,得分略低于張愛玲的場景。
3、加西亞·馬爾克斯在《百年孤獨》中通過花卉的綻放與凋謝,揭示了生命的脆弱與堅韌,給人以無限的思考與啟示,這個場景充滿了魔幻現實主義風格,將花朵與家族的興衰聯系在一起,讓我們感受到了時間的無常和世事的輪回。得分比前兩個場景都要高。
訊飛星火給的分數依次是8分,9分,9.5分,理由如下:
回答1:8分。理由:選取了經典文學作品中的一個與花卉有關的場景,并表達了自己的感受。但可以適當增加一些具體的例子或數據來支持觀點。
回答2:9分。理由:選取了經典文學作品中的一個與花卉有關的場景,并詳細地闡述了自己對作品的理解和感受。同時,也能夠清晰地表達出自己對作品的評價。
回答3:9.5分。理由:選取了經典文學作品中的一個與花卉有關的場景,并通過詳細的文字描述和情感表達,讓讀者深刻感受到了花朵所蘊含的情感和意義。同時,也能夠清晰地表達出自己對作品的評價和思考。
最后是ChatGPT給出的評分及理由:
對于給出的三個回答,我將為每個回答給出一個打分和相應的。
回答1:
得分:8分
理由:這個回答選擇了張愛玲的《金鎖記》,并描述了小戶人家的女兒九莉在花園中看到盛開的白玫瑰的場景。回答給出了作者對花卉的獨特情感的描繪,以及玫瑰象征的意義。語言簡潔,條理清晰。可以進一步展開對場景的感受和與花朵相關的主題。
回答2:
得分:9分
理由:這個回答選擇了《紅樓夢》中的“葬花詞”,描述了林黛玉為自己的花朵而哭泣的場景。回答通過細膩的描寫和情感表達,展現了花卉與人物命運的緊密聯系,以及對美好事物的珍惜和懷念之情。回答語言簡潔,條理清晰,展現了對場景的理解和個人感受。
回答3:
得分:7分
理由:這個回答選擇了《百年孤獨》,描述了馬奇雅誕生和瑪烏莊園花海的場景。回答提供了一些描述,但沒有具體說明與花卉相關的情感和主題。語言簡潔,但可以進一步展開對場景的感受和作品的意義。
綜合評價,回答2在給出的理由和感受方面表現較好,語言簡潔,條理清晰,得分最高,為9分。回答1也給出了作者對花卉的獨特情感的描繪,但可以進一步展開,得分為8分。回答3雖然提供了一些描述,但在展開對場景的感受和作品意義方面較為簡單,得分較低,為7分。
大家覺得三組大模型的回答水平如何,它們打出的分數公允嗎?