安徽省鼎尖预测大联考
2024
-
2025
学年高三
5
月月考
语文试题
一、现代文阅读(
35
分)
(一)现代文阅读Ⅰ(本题共
5
小题,
19
分)
阅读下面的文字,完成小题。
材料一:
2025
年春节期间,国产大模型
DeepSeek
成为全球
AI
领域的一颗新星。
DeepSeek
开源版本在文本生成、代码编写、逻辑推理等任务中表现优异。这一突破不仅打破了美国在生成式
AI
领域的绝对优势,更以百倍性价比提升的实践路径,为我国
AI
发展注入一剂强心针。
DeepSeek
是源于算法、软件与硬件的系统性协同创新成果。
DeepSeek
的精彩表现是众智和众力相互叠加的成果。尽管
DeepSeek
模型基于
Transformer
架构,并非颠覆性基础理论创新,但是
DeepSeek
的确是
AI
漫漫征途中的精彩一跃,也为
AI
未来发展带来了深刻启示。事实上,
AI
发展迄今取得的成就都是由过往一次次“精彩一跃”绘就而成。
2024
年,诺贝尔物理学奖授予
AI
就是这样一个注解:约翰·霍普菲尔德和杰弗里·辛顿分别从物理学能量最小和玻尔兹曼分布角度优化神经网络模型参数,为当下深度学习的崛起打下了坚实的历史桩基。
DeepSeek
“渐进式突破”路径证明,通过系统工程优化同样能实现跨越式发展,科技创新中不可忽视系统级工程创新的作用。
DeepSeek
之所以实现了百倍性价比提升,其中一个重要原因是在系统软件层面的深度创新。
DeepSeek
首先是算法层次的创新,采用了新的
MoE
架构,即共享专家和大量细粒度路由专家架构。通过将通用知识压缩到共享专家中,减轻路由专家的参数冗余,提高参数效率;在保持参数总量不变的前提下,划分更多的细粒度路由专家,通过灵活地组合路由专家,更准确和有针对性地进行知识表达。同时,通过负载均衡的算法设计,有效缓解了传统
MoE
模型因负载不均衡带来的训练效率低下问题。在系统软件层次,
DeepSeek
采用了大量精细化的系统工程优化。算法和软件的创新与优化,极大地降低了模型的训练成本。
DeepSeek
给我们的启示,更多在于如何在有限的算力情况下,通过算法和软件的协同创新,充分挖掘硬件的极致性能。这对中国未来人工智能发展至关重要,也对国内大模型发展具有启示意义。
随着现代工程技术的蓬勃发展,特别是
DeepSeek
技术使机器学习能力开始更加广泛地普惠大众,重塑机器学习理论根基以阐释这些现象背后的数理机理,使机器学习成为一门兼具理论完备性与技术有效性的学科,已成为当今人工智能领域亟须面对且不可回避的关键科学问题。
(陆航《
DeepSeek
书写智能
【语文】安徽省鼎尖预测大联考2024-2025学年高三5月月考试题(解析版).docx