PANews 1月21日消息,据量子位报道,DeepSeek在GitHub更新的FlashMLA代码中首次出现“MODEL1”名称,覆盖114个文件中28处提及,且与现有版本V32(DeepSeek-V3.2)并列,暗示MODEL1为下一代新架构模型。代码差异显示该模型在KV缓存布局、稀疏性处理及FP8解码等方面进行了优化,或将在春节前后正式发布。结合近期公开的mHC残差连接机制与Engram记忆模块,MODEL1有望整合多项自研创新。
DeepSeek新模型MODEL1代码曝光,疑为全新架构
免责声明:本文版权归原作者所有,不代表MyToken(www.mytokencap.com)观点和立场;如有关于内容、版权等问题,请与我们联系。
相关阅读


经济学家警告:比起重演50年前石油危机,股市泡沫更加脆弱
去美元化是胡扯,关税正在扼杀就业,原油危机掩盖了真正的泡沫。美国参与的所有政权更迭尝试中,约60%完全失败。...
PANews2026-03-12 03:35:00

Bonk.fun团队称黑客已劫持团队账户,并在域名上强制植入盗币程序
PANews 3月12日消息,Bonk.fun团队成员Tom在X平台发布紧急警告,提醒用户暂时不要使用bonk.fun域名,因黑客已劫持团队账户并在域名上强制植入盗币程序。...
PANews2026-03-12 03:31:00
贝莱德 CEO :所有资产的代币化才刚刚开始
贝莱德CEO芬克看好代币化未来,其比特币ETF规模已超千亿美元,旨在将数万亿美元数字资产引导至传统金融产品,实现从房地产到债券的全面代币化。...
PANews2026-03-12 03:23:00