AI技术|2026年2月25日2 分钟Mercury 2 来了:每秒 1000 token 的扩散式推理模型,这速度有点离谱Inception Labs 发布 Mercury 2,基于扩散模型的推理 LLM,在 Blackwell GPU 上达到每秒 1009 tokens,比传统自回归模型快 5 倍以上。#AI推理#LLM#Mercury阅读