北京中考,這場熱度僅次于全國高考的考試今日正式拉開帷幕。今年的北京中考把歷史、地理、化學(xué)、生物這四科調(diào)整為等級考試,總分也精簡為510分,是改制后的第一屆新中考,自然更是備受關(guān)注。
今年的北京中考有11.05萬人參加,也吸引著眾多“場外選手”躍躍欲試。大家早已走出校門多年,那些復(fù)雜的公式和定理或許已在記憶深處蒙塵,但是語文作文題目還是可以挑戰(zhàn)一下的。
如今AI大模型技術(shù)發(fā)展迅速,AIGC(人工智能生成內(nèi)容)也正是它們最擅長的地方,中考作文,無疑也是它們施展才華的絕佳舞臺。今天,我們使用7個主流的人工智能大模型讓它們同場競技,并且邀請了兩位在教育領(lǐng)域深耕多年的專家共同為大模型的作品進(jìn)行點評,看看在這場中考作文橫評中,誰才是真正的學(xué)霸?
參測大模型:
本次測試的7個大模型平臺分別是:引發(fā)AI大模型全面爆發(fā)的國際大牌ChatGPT;國內(nèi)傳統(tǒng)互聯(lián)網(wǎng)大廠BAT旗下的文心一言、通義千問和騰訊元寶;唯一純血全國產(chǎn)的訊飛星火;今年春節(jié)期間開始爆火的DeepSeek;短視頻平臺起家的字節(jié)豆包。
測試環(huán)境:
今年的北京中考作文題目和往年一樣,有兩個題目供考生選擇。我們挑選了與科技相關(guān)的“一堂科學(xué)課”作為測試題目。
在測試中,我們使用各自的網(wǎng)頁端進(jìn)行測試,以確認(rèn)都是最新版本。統(tǒng)一打開深度思考、關(guān)閉聯(lián)網(wǎng)功能,避免網(wǎng)絡(luò)數(shù)據(jù)干擾,保證得到的結(jié)果都能代表各自的真實實力。在這些大模型平臺中,騰訊元寶可接入DeepSeek,手動將其選擇為自家的混元大模型;文心一言也有文心4.5 Turbo和文心X1 Turbo兩種版本可選,在此選擇支持深度思考的X1大模型進(jìn)行測試。測試過程以文字錄入真題的方式,輸入同樣的指令進(jìn)行“考試”。具體指令如下:
按要求寫一篇作文。世界是一個科學(xué)大課堂,時時學(xué)科學(xué),處處用科學(xué)。閱讀經(jīng)典作品、參與社會實踐、暢游海底遙望星空……我們增長科學(xué)知識,領(lǐng)悟科學(xué)精神,提高科學(xué)素養(yǎng)。請以“一堂科學(xué)課”為題,寫一篇作文。文體不限,詩歌除外。要求:作文內(nèi)容積極向上,字?jǐn)?shù)在600-800之間,不出現(xiàn)真實的學(xué)校名稱、師生姓名等。
在它們各自完成作文后,再由兩位專家根據(jù)中考評分要求進(jìn)行打分(總分40分)。這兩位專家分別是全國性課程體系研發(fā)專家、中考命題高級研究員敬笑笑老師,以及全國頭部教培機構(gòu)師訓(xùn)負(fù)責(zé)人、全國高考語文高端論壇組織者、分享人李欣雅老師,他們多次負(fù)責(zé)中高考相關(guān)的命題、批改工作,在相關(guān)領(lǐng)域有非常豐富的實操經(jīng)驗。
接下來,我們先來看看這些大模型平臺的具體表現(xiàn)吧。
該大模型思考過程非常簡單,只是分析了題意然后就直接作答,幾乎沒有將推理過程顯示在前臺。
至于生成的作文,從一次觀展的過程展開,和主題結(jié)合緊密,文筆也比較流暢。個人覺得內(nèi)容略顯空泛,很多地方都是淺嘗輒止,除了深海區(qū)簡單提到了一些科學(xué)知識,其他板塊都缺乏科學(xué)知識支持,有點像一個想象出來的游記。
專家評分:33/35,平均分34
專家點評:本篇作文立意明確,緊扣主題,通過海洋館參觀的經(jīng)歷,展現(xiàn)領(lǐng)悟科學(xué)魅力的過程。整體結(jié)構(gòu)清晰,語言通順流暢,描寫生動,具有現(xiàn)場感。結(jié)尾升華主題,點明科學(xué)對于我們的價值與意義。本文不足之處在于描寫不夠具體,需要有更加詳實的細(xì)節(jié)支撐,同時在結(jié)構(gòu)上缺乏聚焦感,需要針對寫作的重點進(jìn)行進(jìn)一步優(yōu)化。
思考過程完整,想到了寫作文時比較重要的三段式結(jié)構(gòu)、具體內(nèi)容、修辭使用等,算是比較中規(guī)中矩的推理思路。
本文邏輯清晰,用物理科學(xué)課講述了一些光學(xué)知識,最終的成品也和推理過程一樣,這是一篇公式化作文,選題也是比較大眾化的做實驗過程,完整地記錄了一整堂課,從失敗中總結(jié)經(jīng)驗,略顯套路。其中不乏一些亮點,比如文中大量使用比喻,包括對老師的神態(tài)及語言描寫等,都比較有詩意,但這些似乎更適合用在抒情散文里,略顯偏離“科學(xué)課”的主題。
專家評分:35/34,平均分34.5
專家點評:本文以一堂物理實驗課為切入點,通過"捕捉光的軌跡"這一主題,展現(xiàn)了科學(xué)探索的完整過程。文章構(gòu)思巧妙,將抽象的科學(xué)原理具象化,符合題意且中心突出。場景描寫極具感染力,營造出濃厚的科學(xué)氛圍,人物互動真實自然。建議適當(dāng)簡化部分修飾性語句,增加實驗過程中的心理描寫,使科學(xué)發(fā)現(xiàn)的驚喜感更強烈。

在推理思考過程考慮到了中考評分標(biāo)準(zhǔn),屬于一個不錯的加分項。另外,也考慮到了文章結(jié)構(gòu)、選題、描寫方式等,最后還有檢查、修改環(huán)節(jié),推理過程比較完整。
本文通過觀測星象這一科學(xué)活動,寫出了同學(xué)在老師帶領(lǐng)下學(xué)習(xí)天文知識的過程。文章結(jié)構(gòu)緊密,行文流暢,結(jié)論部分也結(jié)合本文提到的天文學(xué)知識進(jìn)行了比喻,比較精妙。同時,本文也是少有的引用了古文的作品之一,要知道在中高考作文中,恰當(dāng)?shù)匾煤迷~佳句,也是一個比較重要的加分項。
專家評分:38/39,平均分38.5
專家點評:本篇作文以夜觀星象切入,將光污染等科學(xué)概念與《楚辭》的星空聯(lián)結(jié),揭示“科學(xué)是古今探索的共鳴”的主題,立意深刻。語言極具文采與感染力,善用比喻和引用,兼具科學(xué)性與文學(xué)美。結(jié)構(gòu)嚴(yán)謹(jǐn),“星光”貫穿始終,從雀躍期待到沉醉觀察,從光污染困擾到生活化頓悟,層層遞進(jìn),結(jié)尾升華自然有力。細(xì)節(jié)描寫生動傳神,氛圍營造出色,展現(xiàn)了極高的文學(xué)素養(yǎng)和對科學(xué)精神的深刻理解,為一類文典范。
思考過程想到了北京中考的閱卷標(biāo)準(zhǔn),預(yù)計這對于后期生成文章幫助比較大。同時對于文章結(jié)構(gòu)、內(nèi)容選擇等也有考量,算是一個比較完整的思考過程。
文章通過一次沒那么成功的生態(tài)瓶制作過程,展示了同學(xué)們遇到問題解決問題的過程,在最后點明中心,這是標(biāo)準(zhǔn)化的應(yīng)試作文寫法。個人覺得文章略顯“流水賬”,可以適當(dāng)區(qū)分一下重點。還有一個細(xì)節(jié)改進(jìn)建議,部分句子的連接關(guān)系比較突兀,比如第一段同學(xué)們準(zhǔn)備微型生態(tài)系統(tǒng),“卻”意外成為難忘的科學(xué)課,這原本并不是反向的轉(zhuǎn)折關(guān)系,存在用詞錯誤。
專家評分:35/37,平均分36
專家點評:本文以生態(tài)瓶實驗為載體,生動展現(xiàn)了科學(xué)探究的全過程,符合題意且中心明確。實驗失敗的細(xì)節(jié)描寫真實可感,改進(jìn)過程條理清晰,較好體現(xiàn)了科學(xué)探索精神。有兩處可提升:一是結(jié)尾議論稍顯冗長,建議精簡重復(fù)表述;二是文章結(jié)構(gòu)完整,但實驗轉(zhuǎn)折處的過渡略顯生硬,若能補充小組討論細(xì)節(jié)會更自然。
思考的結(jié)構(gòu)完整,也考慮到了行文布局,通過觀察、提問、驗證等方式進(jìn)行學(xué)習(xí),符合大多數(shù)科學(xué)研究的過程。對寫文章這件事的思考較少,比如行文方式、段落分布等,更多的還是在考慮具體的事件發(fā)展細(xì)節(jié)。
本文選題很有意思,沒有從傳統(tǒng)意義上的科學(xué)出發(fā),而是想到了一個觀察螞蟻的小事,但是科學(xué)也正是一件件小事積累起來的。文章里使用了非常多的細(xì)節(jié)描寫,比如老師身上的粉筆灰、同學(xué)的馬尾辮等,增加了真實感,但是這些細(xì)節(jié)和主題關(guān)系不大,整體閱讀下來反而有點缺乏重心,閱卷老師在快速批改時容易錯過重點,在考試中丟分。
專家評分:34/36,平均分35
專家點評:本篇作文立意新穎深刻,以觀察螞蟻的實驗生動詮釋了科學(xué)源于觀察與實踐的主題。語言表現(xiàn)力突出,使科學(xué)探索過程極具趣味性和現(xiàn)場感。結(jié)尾升華主題,“觸到宇宙心跳”使表述更具詩意。本文的不足之處是部分內(nèi)容可以更加凝練,使文章結(jié)構(gòu)更加精巧。
這個大模型的思考過程就很詳細(xì)了,考慮到了構(gòu)思的具體內(nèi)容,開篇點題、中間部分的層次感、結(jié)尾呼應(yīng)開頭等,這些都是考試評分的要點。
本文運用了不少的比喻等修辭手法,閱讀體驗較好。詳細(xì)描寫了一場和同學(xué)一起進(jìn)行的科學(xué)實驗,讓沒參與的人也能從中學(xué)到知識。文章不僅描述了參觀過程,在結(jié)尾還有一定的思考,符合考試要求。
專家評分:37/39,平均分38
專家點評:本篇作文立意清晰,通過科技館的實踐體驗,生動詮釋了科學(xué)源于生活、探索貴在協(xié)作的真諦。語言流暢優(yōu)美,對“協(xié)作共振”實驗過程的描寫細(xì)膩生動,極具畫面感和感染力。結(jié)構(gòu)清晰,按“參觀—體驗—領(lǐng)悟”展開,重點突出協(xié)作環(huán)節(jié),結(jié)尾的感悟更富哲理,為一類文中上之作。
在思考過程中,該大模型根據(jù)要求考慮到中考作文的一般展開方式,符合標(biāo)準(zhǔn)的“公式化作文”其實是很討巧的,這對老師評分影響很大。構(gòu)思的文章主題也很符合題目要求,并且有大致的段落安排,這對后期寫文章很有好處。
本文通過觀察月全食的過程,讓同學(xué)們從中學(xué)習(xí)了天文學(xué)知識。很好地完成了思考過程的內(nèi)容。其中有一段因為云層干擾,老師鼓勵學(xué)生的橋段很吸引眼球,這種真實的故事很容易打動人,而且這個段落還有一個沒有明說的深意:學(xué)生從此埋下了在科學(xué)道路上不怕困難,用于拼搏的種子。
專家評分:37/38,平均分37.5
專家點評:本篇作文符合題意,立意明確,圍繞觀測月全食,傳達(dá)了對科學(xué)探索本質(zhì)的認(rèn)識。內(nèi)容具體充實,對月食過程的描寫尤為生動形象。結(jié)構(gòu)嚴(yán)謹(jǐn),按時間順序敘述觀測過程,融合科學(xué)知識與歷史人物,拓展了文章深度,體現(xiàn)出較好的文化素養(yǎng),符合一類文的標(biāo)準(zhǔn)。
看完各自的表現(xiàn),我們總結(jié)了專家老師給它們的評分,具體得分如下:
從這7個大模型平臺的思考過程以及最終輸出的作品來看,目前的大模型生成能力都已經(jīng)很強了,特別是這種提供了寫作內(nèi)容,目標(biāo)比較明確的指令,各家都能較好地分析需求,然后給出結(jié)果,不會出現(xiàn)偏題等明顯問題。
在細(xì)節(jié)部分,各家仍然是有所差距的,比如“外來的和尚”ChatGPT對于中文環(huán)境還是有待繼續(xù)開發(fā),它的思考過程和作品都比較生澀;豆包和文心一言則是略顯公式化,輸出的內(nèi)容算是合格,但是也缺乏亮點;通義和騰訊元寶的問題比較類似,單看沒一句都不錯,但是放在文章中就顯得有點詞藻堆砌,缺乏重點了。
表現(xiàn)較好的就是訊飛星火和DeepSeek了,它們分別拿下了本次評測的前兩名,特別是前者,在思考過程中考慮到了閱卷要求,輸出的內(nèi)容也符合題意,在保證文章結(jié)構(gòu)的前提下,不僅引用了好詞佳句,還有“作者”自己的思考,文章不會有太多的“AI味”。
如今AI大模型工具已經(jīng)深入我們的生活,它們有的還在慢慢摸索前進(jìn),有的已經(jīng)懂得像人一樣思考、學(xué)習(xí),這個看不見摸不著的“同學(xué)”,已經(jīng)越來越強大了。