关闭广告

我让7个AI写了今年的高考作文,还找语文老师打了分

差评12747人阅读



一年一度的全民热点——高考!

又来了!

每到这个时候,各大网站的热搜头条,必定被高考二字占领,之所以那些网友们对高考的关注度这么高,除了自己曾经也参与过高考之外,更多的还是心里想着,终于有人感受我曾经的痛苦了!



而高考词条中的语文作文,更是每位网友们逃不开的话题。

不到一天,和高考作文相关的微博,就达成了评论上万,点赞十几万的成就。



而今年大家对于高考作文的讨论,和往年有点不一样。随着 AI 大模型的井喷,大家也突然好奇起来了:如果用 AI 来写语文作文,会是一个什么水平呢?

只不过对于这事吧,大家的意见好像并不怎么统一。有说现在的 AI ,写作文水平已经到了双一流学生的水平了。



但也有专家说,现在 AI 写作文,拿不了高分。



巧了嘛,咱们手上别的可能缺, AI 大模型那是一点也不缺的。世超也好奇,这个 AI 写作文到底能是个啥水平?

实践出真理,为了解决我这个疑问,我分别让 6 大语言模型—— ChatGPT 3.5/4 、百度文心一言、科大讯飞星火、 360 智脑、还有微软 Newbing 各写了一篇高考作文。

使用的是这次全国新高考 I 卷,题目是 “ 故事的力量 ” 。



为了让这次的评测更有置信度,世超我还专门去找了一位语文老师,以满分 60 分为标准,对这六大语言模型进行打分。

改分过程采用盲改形式,老师将不会知道他改的文章是由哪个模型写的,最大程度上保证了公平性。

百闻不如一见,下面世超就把这六篇 AI 写的文章和老师的打分评语给出来,不过呢,世超这里先不告诉大家,哪篇文章是哪个 AI 模型写的,大家可以先猜一猜,等到文章结尾,再来给大家公布答案。

咱们先来看第一篇:



老师评语:得分 41 分。

立意基本准确,无偏题现象。但是整篇文章泛泛而谈,太空洞。在写故事的三个部分的时候,过于浮于表面。同时缺少多样的论证方法,全篇以道理论证为主。青少年应该怎么做这一板块里,没有提出具体措施,只是一味强调故事是有力量的,重要的。

第二篇:



老师评语:得分 44 分。

立意准确,但是写的过于官方,尽量不要出现 “ 首先、其次、最后 ” 等字眼,无个人深度思考。其中的亮点是提出了故事的力量具有两面性,要避免故事的滥用。同时在怎么做这一板块中,从创作者、传播者、听众这些角度出发进行思考,是可取的。

第三篇:



老师评语:得分 48 分。

立意准确,逻辑清晰严密。文章文学性较强,在第一段开门见山摆出观点,善于运用举例、引用等多种方式。但是每一段都在举例,缺少更深度的辨析。最后怎么做这一板块也论述的较为合理。比较明显的失分点在于每段都在举例,有堆砌材料凑字数的嫌疑。

第四篇:



老师评语:得分 40 分。

立意基本符合,和第一篇很类似,都是浮于表面泛泛而谈。把故事的作用在翻来覆去的说,没有挖掘出故事作用的内在重要性,也没有例子加以佐证。尽量不要出现 “ 首先、其次、最后 ” 等字眼,是很明显的失分点。

第五篇:



老师评语:得分 39 分。

对于材料内容切记不可直接引用,角度新颖,从个人思维、未来发展、民族形象等角度入手来论述。可惜没有说到如何开拓我们的思维,如何塑造我们对未来的价值观和眼界,也没有具体说如何展现民族形象的。说到底还是写的不够深刻,没有闪光点。

尽量不要出现 “ 首先、其次、最后、综上所述 ” 等字眼。这不是论述类文本,这是议论文,通过表达观点立场,加以论述分析自己的观点。分析论述观点是重点。

第六篇:



老师评语:得分 40 分。

立意基本符合,都是浮于表面泛泛而谈。把故事的作用在翻来覆去的说,要论述的是独特的故事与其价值认知,少说国家,多讨论青年成长!没有挖掘出故事作用的内在重要性,也没有例子加以佐证。

第七篇:



老师评语:得分 49 分。

做好故事的概念诠释是高下。谁的故事,谁讲故事,故事讲的好不好,故事的生活价值社会价值文化价值思考。

本篇文章并不像之前的文章切入点那么大,而是选取小的切入点,有条理的进行分析。这是很不错的。但是缺少一定的对于社会价值生活价值的反思,这是能不能获得高分的关键。

评分结束啦,不知道大家对这样的打分满不满意呢?

大家可以先猜猜这七篇文章分别是哪个 AI 写的,然后再看下面的答案。



第一篇和第二篇,分别是 OpenAI 的 GPT 3.5 和 GPT 4 。

第三篇是来自百度的文心一言。

第四篇是科大讯飞的星火。

第五篇是微软的 Newbing 。

第六篇是 360 智脑。

最后一篇,则是阿里的通义千问。

其中得分最高的两篇,分别来自咱们国内的大模型,通义千问和文心一言,据这位老师说,之所以给通义千问高一分,主要是觉得文心一言的论证方法较为单一,没有更深层次的思考,通义千问虽然切入口比较小,不过他能够有一定的思考在里面。



总结到这次的题目和大模型作文,老师的看法是:

这次作文题目审题门槛低,但概念诠释门槛高。立意基本不会出错,不过要得高分很难。要谈论独特的故事与其价值认知,少说国家,多讨论青年成长。谁的故事,谁讲故事,故事讲的好不好,故事的生活价值、社会价值、文化价值思考,所以做好故事的概念诠释是高下。

其实从这次的评分来看,现在的AI大模型,虽然很难拿到接近60分的高分,但是最高49分的表现,在实际情况下,也超过了不少的中游学生。

单从这次作文的得分上来判断,AI想要考顶尖大学恐怕还不行,但是,考一些稍好的普本应该是没啥问题。



不过也没必要太焦虑,想想,毕竟连曾经的围棋之王柯洁都败在AI手下,世超认为,人类在考试上被AI全面超越也是迟早的事。

只不过,AI只是工具。工具越好用, 占便宜的,不还是我们嘛。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

贝巴爆粗批评曼联:只是一场比赛而已,但得他x的尽快醒过来

直播吧 浏览 10655

中国男篮集训图集第二波 来找找有没有亮点~

直播吧 浏览 11715

疫苗最好尽快打,张文宏就新冠疫情做出最新判断

趣看热点 浏览 421761

智界S7交付困难,另有隐情?不是产能不足,而是有人“使绊子”?

小李车评李建红 浏览 8697

网曝大S犯癫痫住院具俊晔带钱跑路,真相"打脸"了

不八卦会死星人 浏览 15151

苏罗维金被指系瓦格纳集团VIP会员:拥有个人注册号

界面新闻 浏览 11776

男子称怀孕2个月的未婚妻被骗到缅甸:关在四层小楼内

上观新闻 浏览 96983

特斯拉德国工厂将于下周恢复运营,此前遭纵火引发断电而停产

IT之家 浏览 8147

讴歌全新轿车专利商标注册!外观酷似TLX/明年发布

网上车市 浏览 16461

收起你的牛仔裤 早春穿这些连衣裙美极了!

蓓小西 浏览 15451

主场作战!哈利伯顿15中11&10记三分砍下32分7板6助

直播吧 浏览 8538

美媒:中东危机凸显美国"爱国者"导弹部队规模不足

枢密院十号 浏览 59113

纯爷们也开始戴珍珠了

市界 浏览 9446

金与正:若美拦截朝鲜试射的战略武器 将被视为"宣战"

环球网资讯 浏览 85874

李嘉欣晒儿子近照:12岁许建彤长高许多长相成熟

笑猫说说 浏览 11069

市值单日蒸发1300亿美元,英伟达是“AI时代的思科”吗?华尔街三大维度拆解基本面

每日经济新闻 浏览 7420

诸葛亮死前交代刘禅6个字他却记反!光速败光蜀汉江山

趣看热点 浏览 22065

国务院副总理张国清提要求后 河北成立省级领导小组

政知新媒体 浏览 65537

40岁日星官宣结婚,全程回避妻子身份,被扒娶了小9岁前陪酒女

萌神木木 浏览 8833

井柏然刘雯现身机场,两人先后乘车返回住处,交往两年感情稳定

扒虾侃娱 浏览 8889

波兰总理公开喊话:希望在境内部署美国的核武器

环球时报新闻 浏览 68482
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1