成本较GPT降97%！深度求索将下月推出DeepSeek R2？

时间：2025-04-29 20:42:03 作者：Abby

　　4月29日消息，据国内媒体报道称，深度求索可能会在下个月有所行动，推出下一代AI大模型DeepSeek-R2。

　　报道称，DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE)，其结合了更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。

　　有分析师预计，DeepSeek-R2的定价可能显著低于OpenAI同类产品，预示着其可能颠覆现有AI服务的定价模式。

　　此外，还有相关消息显示，DeepSeek-R2预计比GPT-4成本下降97%，并且是在昇腾卡上做的训练，主打一个全方位全产业链的自主可控。

　　据相关人士透露的情况，DeepSeek-R2的总参数量可能会达到1.2万亿，比DeepSeek-R1的6710亿参数增加大约一倍。

　　DeepSeek-R2是一款基于华为昇腾910B(Ascend 910B)芯片集群训练的模型，在FP16精度下达到512PetaFLOPS的计算能力，芯片使用效率为82%。

　　据华为实验室统计，这个性能相当于英伟达上一代A100训练集群的91%左右。至于这些是不是真实的，还有待观察，但看起来确实更强大、更自主了。

成本较GPT降97%！深度求索将下月推出DeepSeek R2？

　　4月29日消息，据国内媒体报道称，深度求索可能会在下个月有所行动，推出下一代AI大模型DeepSeek-R2。　　报道称，DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE)，其结合了更加智能的门控网络层(Gating
九号多维度稳居行业第一！《2025年中国两轮电动车行业研究报告》权威发布

　　近日,艾瑞咨询重磅发布《2025年中国两轮电动车行业研究报告》。报告指出,随着新国标《电动自行车安全技术规范(GB 17761—2024)》正式落地,中国两轮电动车行业迎来技术升级与市场格局重塑的重要时刻。面对新一轮产业变革