您正在访问亚洲外汇网,本站所提供的内容均遵守中华人民共和国香港特别行政区法律法规。

【DeepSeek新模型MODEL1曝光 代码预示新架构】金十数据1月21日讯,DeepSeek-R1发布一周年之际,新

文 / 小金 2026-01-21 08:02:05 来源:亚金网

【DeepSeek新模型MODEL1曝光 代码预示新架构】金十数据1月21日讯,DeepSeek-R1发布一周年之际,新模型“MODEL1”曝光。DeepSeek在GitHub更新FlashMLA代码,横跨114个文件中有28处提到MODEL1,与V32作为不同的模型出现。已知V32是DeepSeek-V3.2,MODEL1很可能是新的架构。代码中的具体差异体现在KV缓存布局、稀疏性处理和FP8解码方面,在内存优化上有多处不同。

 

排行榜 日排行 | 周排行