DeepSeek 在 AI 竞争加剧之际以 $45B 的估值水平完成融资

TechCrunch 报道,中国 AI 实验室 DeepSeek 正在洽谈筹集其首轮融资,估值据称为 450 亿美元。该估值较数周前的估计 200 亿美元估值出现了显著上升,原因是外界关注到该公司的 AI 模型因训练成本更低。创始人 梁文峰 控制着近 90% 的公司股份。

融资动机与投资者兴趣

DeepSeek 在竞争对手试图通过向研究人员提供公司股份来招揽人才之后,决定寻求融资。中国 集成电路产业投资基金 可能将牵头本轮融资;与此同时,据称腾讯和阿里巴巴也在洽谈参与。

模型表现与定价

据公司称,DeepSeek 的 V4 模型在基准测试中的表现据报与 OpenAI 和 Anthropic 的顶级模型不相上下。竞争优势还体现在定价上:V4-Pro 的百万输入 token 价格为 1.74 美元,而 V4-Flash 的百万输入 token 价格约为 0.14 美元——显著低于可比的美国模型定价。

更低的成本结构源于 DeepSeek 的计算高效架构,包括一种 混合专家(MoE)设计:每项任务只激活模型的一部分,从而在推理时减少计算需求。根据 DeepSeek 的说法,V4-Pro 使用的计算能力为 V3.2 的 27%,所需内存为 10%。

中国的 AI 自立战略

DeepSeek 的融资轮发生在中国寻求构建更具自立能力的 AI 基础设施之际,以应对美国对先进芯片的出口管制。V4 是 DeepSeek 首个针对中国芯片(如华为的 Ascend 系列)调优的模型,不过该公司的技术报告指出,中国芯片可用于推理,而训练可能仍主要依赖 Nvidia 硬件。

DeepSeek 还发布开源权重模型——即训练好的参数,其他人可以使用、微调并部署,从而将 AI 开发扩展到美国主导之外。该策略强调算法效率,而不是对最先进的美国硬件的排他性访问,尽管中国的 AI 推进仍在一定程度上依赖 Nvidia 硬件。

© 版权声明
THE END
喜欢就支持一下吧
分享