湖南省娄底市
2025
届高三二模语文试题
一、现代文阅读(
35
分)
(一)现代文阅读Ⅰ(本题共
5
小题,
19
分)
阅读下面的文字,完成下面小题。
材料一:
2025
年,
“
推理模型
”
成为人工智能行业的热词。从科大讯飞发布首个使用全国产算力训练的深度推理大模型——讯飞星火
X1
,到深度求索公司上线
DeepSeek
-
R1
推理模型,都将
“
推理模型
”
推到聚光灯下。在人工智能大模型不断迭代升级的浪潮中,推理模型以创新的技术为行业发展注入新活力,也让人们对人工智能未来发展有了更大想象空间。
___________①___________
在复旦大学计算机科学技术学院教授肖仰华看来,过去,大模型的生成能力主要由语料决定。但专家级的推理能力并非
“
题海战术
”
可以实现,而是需要大模型具备强大的思维能力。
心理学家认为,人类存在两种思维模式。一种是主要用来对日常生活中的简单问题进行判断、决策的
“
快思考
”
;另一种则是用于对一些特定问题进行深入分析、研判的
“
慢思考
”
。
“
快思考
”
是人类基于大量日常经验、常识等,对简单问题作出的快速反应,往往在人们无意识之间完成,是一种更加接近
“
本能
”
的思考方式。与之相对,
“
慢思考
”
则需要调动大脑更多资源,遵循特定思维逻辑,对问题进行抽丝剥茧式分析研究,进而作出更加理性周全的决策。
作为人工智能的典型应用,大模型如今也有了
“
快
”“
慢
”
之别。
传统大语言通用模型的思维方式更像是
“
快思考
”
,其主要依靠算力对海量数据进行学习,实现对后续空白内容的快速预测,回答人类提出的各类问题,本质上是基于概率模型对可能的答案进行
“
猜测
”
。相比之下,推理大模型更有意识和逻辑,会在回答之前进行一段时间
“
慢思考
”
,依据特定思维链条,提供更全面解答。
强化学习实现反思纠错
人类可以对复杂问题进行深入思考、理性分析的一大原因在于,大脑能够反思。通过对过去错误结果和正确经验的反馈学习,人类得以不断提升对复杂问题判断的正确率。推理模型中普遍应用的强化学习技术,在一定程度上模仿了人类的反思、纠错能力。
强化学习是一种机器学习方法,它允许智能体在与环境的交互中通过试错来学习最优策略。智能体在环境中执行相应行动,并根据行动的结果接收反馈,这些反馈信号则指导智能体调整下一步策略,循环往复,不断接近最优策略。
科大讯飞研究院副院长殷兵介绍,讯飞星火
X1
可以进行自我探索和反思验证,并基
于答案正确与否的反馈信息进行强化训练。其中,自我评价迭代
【语文】湖南省娄底市2025届高三二模试题(解析版).docx