PANews 1月21日消息,据量子位报道,DeepSeek在GitHub更新的FlashMLA代码中首次出现“MODEL1”名称,覆盖114个文件中28处提及,且与现有版本V32(DeepSeek-V3.2)并列,暗示MODEL1为下一代新架构模型。代码差异显示该模型在KV缓存布局、稀疏性处理及FP8解码等方面进行了优化,或将在春节前后正式发布。结合近期公开的mHC残差连接机制与Engram记忆模块,MODEL1有望整合多项自研创新。
DeepSeek新模型MODEL1代码曝光,疑为全新架构
免责声明:本文版权归原作者所有,不代表MyToken(www.mytokencap.com)观点和立场;如有关于内容、版权等问题,请与我们联系。
相关阅读


AI Agent之间的支付一定需要Crypto吗?
Visa 是人类信任体系的支付网络,crypto 是机器信任体系的结算层。...
PANews2026-02-13 12:33:00
Moltbook的悖论:币价越是趴窝,用户越是疯涨
Agentic Economy终于开始和那种“纯造概念发币”的AI MEME玩法脱钩了。...
PANews2026-02-13 10:44:00
巴西众议院提出“国家比特币战略储备”替代案,拟5年“囤积”至少100万枚BTC
PANews 2月13日消息,据巴西众议院官网,经济发展委员会提交PL4501/2024替代案:设立国家比特币战略储备RESBit,拟5年“囤积”至少100万枚BTC;拟允许用BTC缴税、对数字资产资...
PANews2026-02-13 10:42:00