大胆国模GOGO人体私拍|女人奶大陰户欣赏|两人剧烈运动扑克牌网站免费|女人吃男人视频|9一14 young处|户外BBBB|国产又色又爽无遮挡免费动态图

^{<rt id="x4tsf"></rt>}

詳情

搜索

首頁>產(chǎn)品評測>>綜合>>>正文

7大主流AI大模型參加北京中考，誰才是真·學(xué)霸

北京中考，這場熱度僅次于全國高考的考試今日正式拉開帷幕。今年的北京中考把歷史、地理、化學(xué)、生物這四科調(diào)整為等級考試，總分也精簡為510分，是改制后的第一屆新中考，自然更是備受關(guān)注。

今年的北京中考有11.05萬人參加，也吸引著眾多“場外選手”躍躍欲試。大家早已走出校門多年，那些復(fù)雜的公式和定理或許已在記憶深處蒙塵，但是語文作文題目還是可以挑戰(zhàn)一下的。

如今AI大模型技術(shù)發(fā)展迅速，AIGC（人工智能生成內(nèi)容）也正是它們最擅長的地方，中考作文，無疑也是它們施展才華的絕佳舞臺。今天，我們使用7個主流的人工智能大模型讓它們同場競技，并且邀請了兩位在教育領(lǐng)域深耕多年的專家共同為大模型的作品進(jìn)行點評，看看在這場中考作文橫評中，誰才是真正的學(xué)霸？

參測大模型：

本次測試的7個大模型平臺分別是：引發(fā)AI大模型全面爆發(fā)的國際大牌ChatGPT；國內(nèi)傳統(tǒng)互聯(lián)網(wǎng)大廠BAT旗下的文心一言、通義千問和騰訊元寶；唯一純血全國產(chǎn)的訊飛星火；今年春節(jié)期間開始爆火的DeepSeek；短視頻平臺起家的字節(jié)豆包。

測試環(huán)境：

今年的北京中考作文題目和往年一樣，有兩個題目供考生選擇。我們挑選了與科技相關(guān)的“一堂科學(xué)課”作為測試題目。

在測試中，我們使用各自的網(wǎng)頁端進(jìn)行測試，以確認(rèn)都是最新版本。統(tǒng)一打開深度思考、關(guān)閉聯(lián)網(wǎng)功能，避免網(wǎng)絡(luò)數(shù)據(jù)干擾，保證得到的結(jié)果都能代表各自的真實實力。在這些大模型平臺中，騰訊元寶可接入DeepSeek，手動將其選擇為自家的混元大模型；文心一言也有文心4.5 Turbo和文心X1 Turbo兩種版本可選，在此選擇支持深度思考的X1大模型進(jìn)行測試。測試過程以文字錄入真題的方式，輸入同樣的指令進(jìn)行“考試”。具體指令如下：

按要求寫一篇作文。世界是一個科學(xué)大課堂，時時學(xué)科學(xué)，處處用科學(xué)。閱讀經(jīng)典作品、參與社會實踐、暢游海底遙望星空……我們增長科學(xué)知識，領(lǐng)悟科學(xué)精神，提高科學(xué)素養(yǎng)。請以“一堂科學(xué)課”為題，寫一篇作文。文體不限，詩歌除外。要求：作文內(nèi)容積極向上，字?jǐn)?shù)在600-800之間，不出現(xiàn)真實的學(xué)校名稱、師生姓名等。

在它們各自完成作文后，再由兩位專家根據(jù)中考評分要求進(jìn)行打分（總分40分）。這兩位專家分別是全國性課程體系研發(fā)專家、中考命題高級研究員敬笑笑老師，以及全國頭部教培機構(gòu)師訓(xùn)負(fù)責(zé)人、全國高考語文高端論壇組織者、分享人李欣雅老師，他們多次負(fù)責(zé)中高考相關(guān)的命題、批改工作，在相關(guān)領(lǐng)域有非常豐富的實操經(jīng)驗。

接下來，我們先來看看這些大模型平臺的具體表現(xiàn)吧。

大模型1：ChatGPT

該大模型思考過程非常簡單，只是分析了題意然后就直接作答，幾乎沒有將推理過程顯示在前臺。

至于生成的作文，從一次觀展的過程展開，和主題結(jié)合緊密，文筆也比較流暢。個人覺得內(nèi)容略顯空泛，很多地方都是淺嘗輒止，除了深海區(qū)簡單提到了一些科學(xué)知識，其他板塊都缺乏科學(xué)知識支持，有點像一個想象出來的游記。

專家評分：33/35，平均分34

專家點評：本篇作文立意明確，緊扣主題，通過海洋館參觀的經(jīng)歷，展現(xiàn)領(lǐng)悟科學(xué)魅力的過程。整體結(jié)構(gòu)清晰，語言通順流暢，描寫生動，具有現(xiàn)場感。結(jié)尾升華主題，點明科學(xué)對于我們的價值與意義。本文不足之處在于描寫不夠具體，需要有更加詳實的細(xì)節(jié)支撐，同時在結(jié)構(gòu)上缺乏聚焦感，需要針對寫作的重點進(jìn)行進(jìn)一步優(yōu)化。

大模型2：文心一言

思考過程完整，想到了寫作文時比較重要的三段式結(jié)構(gòu)、具體內(nèi)容、修辭使用等，算是比較中規(guī)中矩的推理思路。

本文邏輯清晰，用物理科學(xué)課講述了一些光學(xué)知識，最終的成品也和推理過程一樣，這是一篇公式化作文，選題也是比較大眾化的做實驗過程，完整地記錄了一整堂課，從失敗中總結(jié)經(jīng)驗，略顯套路。其中不乏一些亮點，比如文中大量使用比喻，包括對老師的神態(tài)及語言描寫等，都比較有詩意，但這些似乎更適合用在抒情散文里，略顯偏離“科學(xué)課”的主題。

專家評分：35/34，平均分34.5

專家點評：本文以一堂物理實驗課為切入點，通過"捕捉光的軌跡"這一主題，展現(xiàn)了科學(xué)探索的完整過程。文章構(gòu)思巧妙，將抽象的科學(xué)原理具象化，符合題意且中心突出。場景描寫極具感染力，營造出濃厚的科學(xué)氛圍，人物互動真實自然。建議適當(dāng)簡化部分修飾性語句，增加實驗過程中的心理描寫，使科學(xué)發(fā)現(xiàn)的驚喜感更強烈。

大模型3：訊飛星火

在推理思考過程考慮到了中考評分標(biāo)準(zhǔn)，屬于一個不錯的加分項。另外，也考慮到了文章結(jié)構(gòu)、選題、描寫方式等，最后還有檢查、修改環(huán)節(jié)，推理過程比較完整。

本文通過觀測星象這一科學(xué)活動，寫出了同學(xué)在老師帶領(lǐng)下學(xué)習(xí)天文知識的過程。文章結(jié)構(gòu)緊密，行文流暢，結(jié)論部分也結(jié)合本文提到的天文學(xué)知識進(jìn)行了比喻，比較精妙。同時，本文也是少有的引用了古文的作品之一，要知道在中高考作文中，恰當(dāng)?shù)匾煤迷~佳句，也是一個比較重要的加分項。

專家評分：38/39，平均分38.5

專家點評：本篇作文以夜觀星象切入，將光污染等科學(xué)概念與《楚辭》的星空聯(lián)結(jié)，揭示“科學(xué)是古今探索的共鳴”的主題，立意深刻。語言極具文采與感染力，善用比喻和引用，兼具科學(xué)性與文學(xué)美。結(jié)構(gòu)嚴(yán)謹(jǐn)，“星光”貫穿始終，從雀躍期待到沉醉觀察，從光污染困擾到生活化頓悟，層層遞進(jìn)，結(jié)尾升華自然有力。細(xì)節(jié)描寫生動傳神，氛圍營造出色，展現(xiàn)了極高的文學(xué)素養(yǎng)和對科學(xué)精神的深刻理解，為一類文典范。

大模型4：通義

思考過程想到了北京中考的閱卷標(biāo)準(zhǔn)，預(yù)計這對于后期生成文章幫助比較大。同時對于文章結(jié)構(gòu)、內(nèi)容選擇等也有考量，算是一個比較完整的思考過程。

文章通過一次沒那么成功的生態(tài)瓶制作過程，展示了同學(xué)們遇到問題解決問題的過程，在最后點明中心，這是標(biāo)準(zhǔn)化的應(yīng)試作文寫法。個人覺得文章略顯“流水賬”，可以適當(dāng)區(qū)分一下重點。還有一個細(xì)節(jié)改進(jìn)建議，部分句子的連接關(guān)系比較突兀，比如第一段同學(xué)們準(zhǔn)備微型生態(tài)系統(tǒng)，“卻”意外成為難忘的科學(xué)課，這原本并不是反向的轉(zhuǎn)折關(guān)系，存在用詞錯誤。

專家評分：35/37，平均分36

專家點評：本文以生態(tài)瓶實驗為載體，生動展現(xiàn)了科學(xué)探究的全過程，符合題意且中心明確。實驗失敗的細(xì)節(jié)描寫真實可感，改進(jìn)過程條理清晰，較好體現(xiàn)了科學(xué)探索精神。有兩處可提升：一是結(jié)尾議論稍顯冗長，建議精簡重復(fù)表述；二是文章結(jié)構(gòu)完整，但實驗轉(zhuǎn)折處的過渡略顯生硬，若能補充小組討論細(xì)節(jié)會更自然。

大模型5：騰訊元寶

思考的結(jié)構(gòu)完整，也考慮到了行文布局，通過觀察、提問、驗證等方式進(jìn)行學(xué)習(xí)，符合大多數(shù)科學(xué)研究的過程。對寫文章這件事的思考較少，比如行文方式、段落分布等，更多的還是在考慮具體的事件發(fā)展細(xì)節(jié)。

本文選題很有意思，沒有從傳統(tǒng)意義上的科學(xué)出發(fā)，而是想到了一個觀察螞蟻的小事，但是科學(xué)也正是一件件小事積累起來的。文章里使用了非常多的細(xì)節(jié)描寫，比如老師身上的粉筆灰、同學(xué)的馬尾辮等，增加了真實感，但是這些細(xì)節(jié)和主題關(guān)系不大，整體閱讀下來反而有點缺乏重心，閱卷老師在快速批改時容易錯過重點，在考試中丟分。

專家評分：34/36，平均分35

專家點評：本篇作文立意新穎深刻，以觀察螞蟻的實驗生動詮釋了科學(xué)源于觀察與實踐的主題。語言表現(xiàn)力突出，使科學(xué)探索過程極具趣味性和現(xiàn)場感。結(jié)尾升華主題，“觸到宇宙心跳”使表述更具詩意。本文的不足之處是部分內(nèi)容可以更加凝練，使文章結(jié)構(gòu)更加精巧。

大模型6：DeepSeek

這個大模型的思考過程就很詳細(xì)了，考慮到了構(gòu)思的具體內(nèi)容，開篇點題、中間部分的層次感、結(jié)尾呼應(yīng)開頭等，這些都是考試評分的要點。

本文運用了不少的比喻等修辭手法，閱讀體驗較好。詳細(xì)描寫了一場和同學(xué)一起進(jìn)行的科學(xué)實驗，讓沒參與的人也能從中學(xué)到知識。文章不僅描述了參觀過程，在結(jié)尾還有一定的思考，符合考試要求。

專家評分：37/39，平均分38

專家點評：本篇作文立意清晰，通過科技館的實踐體驗，生動詮釋了科學(xué)源于生活、探索貴在協(xié)作的真諦。語言流暢優(yōu)美，對“協(xié)作共振”實驗過程的描寫細(xì)膩生動，極具畫面感和感染力。結(jié)構(gòu)清晰，按“參觀—體驗—領(lǐng)悟”展開，重點突出協(xié)作環(huán)節(jié)，結(jié)尾的感悟更富哲理，為一類文中上之作。

大模型7：豆包

在思考過程中，該大模型根據(jù)要求考慮到中考作文的一般展開方式，符合標(biāo)準(zhǔn)的“公式化作文”其實是很討巧的，這對老師評分影響很大。構(gòu)思的文章主題也很符合題目要求，并且有大致的段落安排，這對后期寫文章很有好處。

本文通過觀察月全食的過程，讓同學(xué)們從中學(xué)習(xí)了天文學(xué)知識。很好地完成了思考過程的內(nèi)容。其中有一段因為云層干擾，老師鼓勵學(xué)生的橋段很吸引眼球，這種真實的故事很容易打動人，而且這個段落還有一個沒有明說的深意：學(xué)生從此埋下了在科學(xué)道路上不怕困難，用于拼搏的種子。

專家評分：37/38，平均分37.5

專家點評：本篇作文符合題意，立意明確，圍繞觀測月全食，傳達(dá)了對科學(xué)探索本質(zhì)的認(rèn)識。內(nèi)容具體充實，對月食過程的描寫尤為生動形象。結(jié)構(gòu)嚴(yán)謹(jǐn)，按時間順序敘述觀測過程，融合科學(xué)知識與歷史人物，拓展了文章深度，體現(xiàn)出較好的文化素養(yǎng)，符合一類文的標(biāo)準(zhǔn)。

總結(jié)

看完各自的表現(xiàn)，我們總結(jié)了專家老師給它們的評分，具體得分如下：

從這7個大模型平臺的思考過程以及最終輸出的作品來看，目前的大模型生成能力都已經(jīng)很強了，特別是這種提供了寫作內(nèi)容，目標(biāo)比較明確的指令，各家都能較好地分析需求，然后給出結(jié)果，不會出現(xiàn)偏題等明顯問題。

在細(xì)節(jié)部分，各家仍然是有所差距的，比如“外來的和尚”ChatGPT對于中文環(huán)境還是有待繼續(xù)開發(fā)，它的思考過程和作品都比較生澀；豆包和文心一言則是略顯公式化，輸出的內(nèi)容算是合格，但是也缺乏亮點；通義和騰訊元寶的問題比較類似，單看沒一句都不錯，但是放在文章中就顯得有點詞藻堆砌，缺乏重點了。

表現(xiàn)較好的就是訊飛星火和DeepSeek了，它們分別拿下了本次評測的前兩名，特別是前者，在思考過程中考慮到了閱卷要求，輸出的內(nèi)容也符合題意，在保證文章結(jié)構(gòu)的前提下，不僅引用了好詞佳句，還有“作者”自己的思考，文章不會有太多的“AI味”。

如今AI大模型工具已經(jīng)深入我們的生活，它們有的還在慢慢摸索前進(jìn)，有的已經(jīng)懂得像人一樣思考、學(xué)習(xí)，這個看不見摸不著的“同學(xué)”，已經(jīng)越來越強大了。