证券时报网讯,中信建投研报表示,Deepseek发布深度推理能力模型。R1-Zero采用纯粹的强化学习训练,证明了大语言模型仅通过强化学习也可以有强大的推理能力,DeepSeek-R1经历微调和强化学习取得了与OpenAI-o1-1217相媲美甚至超越的成绩。DeepSeek R1训练和推理算力需求较低,主要原因是DeepSeek R1实现算法、框架和硬件的优化协同。过去的预训练侧的scaling law正逐步迈向更广阔的空间,在深度推理的阶段,模型的未来算力需求依然会呈现爆发式上涨,充足的算力需求对于人工智能模型的性能进步依然至关重要。
举报负责人:田站长(账号昵称乡村发展网);举报电话:023-72261733;举报邮箱:773987997@qq.com;
业务联系手机/微信:18996816733;邮箱:2386489682@qq.com;
公司地址:涪陵区松翠路23号附11号;
办公地址:重庆市涪陵区兴涪路兴涪公寓9-3;