东方财富网 > 研报大全 > 行业研报正文

DeepSeek对AI产业的影响:深度分析DeepSeek爆火背后,AI产业将面临怎样的颠覆与冲击?

www.eastmoney.com 头豹研究院 陈庆民 查看PDF原文



名称 相关 涨跌幅



名称 相关 净流入(万)

  DeepSeek的成本争议不仅关乎成本数字, 而是预示着行业范式的迁移,即推理效率取代训练规模成为AI商业化的核心瓶颈。 大模型赛道的最终赢家将是那些在“算法效率”与“成本透明度”上双赢的企业

  DeepSeek V3训练成本争议背后的技术范式与行业博弈分析

  事件背景

  DeepSeek引发的争议主要集中在其低成本的训练模型上,尤其是V3模型的训练费用。 DeepSeek的V3模型训练仅花费了557.6万美元(通过租赁278.8万个H800 GPU小时来计算的成本,平均每小时租金为2美元折算),大概是GPT-4的1/20。

  1 DeepSeek强调的“一次性训练成本”与硅谷看重的“全周期开发成本”碰撞出成本统计口径"罗生门"现象

  一次性训练成本统计口径支持方

  一次性训练成本统计口径的支持方通常认为, DeepSeek之所以能实现低训练成本,得益于云计算资源的灵活租赁。 与传统自建集群模式相比, DeepSeek通过租赁公有云中的GPU, 减少了对固定硬件的依赖,进而减轻了初期硬件投资的压力。这种做法更契合精益创业思维,即以较小成本进行快速实验和迭代,在一定程度上降低风险。 精益创业思维强调在资源有限的情况下快速创新,利用弹性计算优化硬件资源使用,而非一开始就大规模投入资本。支持方认为,这种模式挑战了传统硬件采购模式,能在短期内实现技术突破和获得竞争优势。

  全周期开发成本支持方

  全周期开发成本的支持者强调,在传统大型模型开发中,必须重视整个生命周期中的成本投入。其核心观点是, 研发过程中诸如硬件采购和试错成本等投资不仅不可忽视,而且应被视为“沉没成本资产化”的一部分。 例如, DeepSeek仅在硬件采购上可能就花费了超过5亿美元。此外, DeepSeek开发新的架构(如MLA架构和稀疏模型)通常需要数月的时间进行实验、调优和验证,期间失败尝试带来的成本同样非常高昂。因此, DeepSeek所公布的557.6万美元训练成本严重低估了实际总投入,未能全面考虑包括硬件采购、人员薪酬及试错成本在内的全周期开发成本。

郑重声明:东方财富发布此内容旨在传播更多的信息,与本站立场无关,不代表东方财富观点。建议用户在阅读研报过程中,请认真仔细阅读研报里的风险提示、免责声明、重要声明等内容,用户据此操作风险自担。
文中涉及到的个股
最新研究报告
热门个股评级一览
个股未来3年盈利预测
个股财务指标排行榜
以下数据基于个股最新报告期
热门行业追踪

数据来源:东方财富Choice数据

郑重声明:东方财富网发布此信息的目的在于传播更多信息,与本站立场无关。东方财富网不保证该信息(包括但不限于文字、视频、音频、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关信息并未经过本网站证实,不对您构成任何投资建议,据此操作,风险自担。

信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500