當前位置: 妍妍網 > 碼農

用7個國產大模型寫高考作文,讓ChatGPT4來打分,KIMI居然連字數都沒寫夠

2024-06-07碼農

祝莘莘學子高考必勝

2024高考語文結束了,高考作文又成為了備受關註的熱點,AI時代也進入了高考作文內容中

新課標I卷的題目:

隨著互聯網的普及、人工智慧的套用,越來越多的問題能很快得到答案。那麽,我們的問題是否會越來越少?

以上材料引發了你怎樣的聯想和思考?請寫一篇文章。

要求:選準角度,確定立意,明確文體,自擬標題;不要套作,不得抄襲;不得泄露個人資訊;不少於800字。

今天就來讓當下比較火的國內大模型來寫高考作文,並且用ChatGPT4來打分,看下誰家模型作文寫的更好。

參賽選手: KIMI、豆包、騰訊混元、通義千問、文心一言、訊飛星火、智普GLM

閱卷評委: ChatGPT4

掃碼加入AI交流群

獲得更多技術支持和交流

(請註明自己的職業)

為什麽選擇ChatGPT4作為閱卷評委

ChatGPT4是國外的大模型,經過測試,在相同提示詞的情況下,ChatGPT4給自己寫的作文打了最低分,這是一個比較公平公正的閱卷評委。

打分及字數統計

先看打分結果,最高分通義千問,最低分ChatGPT4,可能他有點水土不服吧。

當然,不能忽略作文題目裏的一個要求,800字以上

KIMI是字數明顯不夠的,必須要批評,可能是交卷了沒寫完吧,按理說應該再扣點分,畢竟大家都參加過高考,都知道作文紙上有個800字的線,這不滿肯定得多少扣點了。

大家一起來再看下各家大模型寫的作文內容

內容PK

ChatGPT4

KIMI

豆包

騰訊混元

通義千問

文心一言

訊飛星火

智普GLM

總結

測試了幾個國外模型,對於高考作文的寫作確實是不如國內大模型寫得好。

從這些作文裏也看出一個問題,所有的模型都有的優點、也是通病,過於講求邏輯能力,「首先,其次,再次,此外」諸如此類的詞匯實在是太多,導致讀起來有流水賬的感覺。

看著國內大模型崛起,作為AI行業的從業者,從心底裏高興。

最後再次祝願高考考生旗開得勝,高考加油!

關註「 開源AI計畫落地 」公眾號

與AI時代更靠近一點