Skip to main content

💧 #小众软件最强开源模型 DeepSeek V4 发布,1M上下文,运行成本大降DeepSeek V4 终于发布了,带来了 1M 上下文,代码能力明显提升,推理进入第一梯队,但知识类能力仍落后于头部闭源模型

  1. 💧 #小众软件
    最强开源模型 DeepSeek V4 发布,1M上下文,运行成本大降

    DeepSeek V4 终于发布了,带来了 1M 上下文,代码能力明显提升,推理进入第一梯队,但知识类能力仍落后于头部闭源模型。

    最重要的是:「DeepSeek-V4 开创了一种全新的注意力机制,在 token 维度进行压缩,结合 DSA 稀疏注意力(DeepSeek Sparse Attention),实现了全球领先的长上下文能力,并且相比于传统方法大幅降低了对计算和显存的需求。从现在开始,1M(一百万)上下文将是 DeepSeek 所有官方服务的标配。」

    https://www.appinn.com/deepseek-v4/ 最强开源模型 DeepSeek V4 发布,1M上下文,运行成本大降 - 小众软件